Hazy Ideas

日々の勉強の気づきを書き出しています

統計学で出てくるp値とは何なのか

〇p値って何?

p値とは、probabilityを表すpを頭文字にした統計学の指標です。p値はある事象が、推定した確率分布・モデルのもとで、元々の想定と同程度か、より離れている(大小など)かを示すものです。p値は0から1までの値をとります。

統計の世界では、仮説検定と言って、評価する物事に差があるかないか仮説を立てて判断します。差がないという仮定を帰無仮説と呼び、差があるという仮定を対立仮説と呼びます。差がある傾向が強い場合にはp値が低くなり、逆に差がない確率が高いという場合にはp値が高くなります。一般的には、p値が0.05を下回る(有意水準5%といいます)と、差がないとは言えない(帰無仮説を棄却する)、という判断をします。なお、この0.05という値は、目的や分野によっても異なることがあります。

p値の計算方法は、帰無仮説が棄却されうる確率、つまり対立仮説となる確率を算出し、足し合わせることです。これを累積確立と呼び、累積確立が0.05以下であれば「有意差あり」といえるということです。

〇p値の注意点とは

近年、帰無仮説による有意性の検定を利用しないという動きがあります。この理由は何なのでしょうか?

統計におけるp値は、サンプル数が少ないと有意差が出にくくなります。本来は差があるのに、有意差がないと判定される誤りのことを、第1種の過誤と呼びます(逆に、本来は差がないのに、差があるという誤った判定をすることを、第2種の過誤と呼びます)。

またp値はあくまで統計モデルに対する整合性を示す数字であるため、事象に対する仮説が真である確率を示したものではないということです。ゆえに、科学的な議論や、政策・ビジネスの意思決定に、p値のみを使うのは根拠として不適切といえます。

加えて、上記ではp<0.05を有意の基準とする、というような内容で書きましたが、これも便宜的なものです。先人たちが95%を基準にしようと経験的に決めた数値であり、科学的に根拠のある数値ではないことに留意が必要です。例えば物質Aに対して物質Bではp=0.04、物質Bではp=0.06であったとしても、BとCに本質的な違いがあるとは言えないのです。

そして、解析者が目的に合わせてデータを調整したり、複数のデータを解析をした上で有意な結果のみを報告したりすることは、一部のジャーナルにおいて控えるように推奨されます。また解析後の結果を、p値のみで報告・説明することも避けるべきとされています。その他の解析値を含めた解釈によって、より適切な科学的考察を行うことができます。

〇まとめ

p値は有効な統計の指標ですが、あくまで数学的に出てくる値です。便利なのでついついp値の結果のみに目が行きがちですが、データを丁寧に見る必要があります。また効果の大きさや影響を示すものではないことにも注意が必要です。