Fisher Matrix 入門: 実験精度を予測するための手法
データ分析のプロジェクトや新しい実験を計画する際、事前に「どの程度のデータを集めれば目標の精度に到達できるか」を見積もることは、コストと成果のバランスを最適化する上で欠かせないステップです。 このような実験設計において強 […]
GPyTorch ではじめる深層ガウス過程入門
ガウス過程(GP: Gaussian Process)は、関数そのものに確率分布を定義するノンパラメトリックなモデルです。このモデルの最大の強みは、単なる予測値だけでなく、その不確実性(信頼区間)を定量的に示せる点にあり […]
データ分析や機械学習における外れ値の扱い方
データ分析や機械学習の分野において、「外れ値」の存在は避けて通れない課題の一つです。外れ値とは、データセットの中で他の大多数のデータポイントから大きくかけ離れた値のことを指します。これらは測定誤差、入力ミス、あるいは特異 […]
「統計的に有意」にだまされてはいけない
科学論文やニュース記事などで、「統計的に有意」という表現を目にしたことがあるのではないでしょうか?一見、説得力がありそうなこの言葉ですが、実は誤解を招きやすい側面も持ち合わせています。 今回は、「統計的に有意」が本当の意 […]