
高校レベルの数学で理解できる内容にするため、実際に統計で行なっている検定とは異なる例をあげていますが、とりあえずp値ってどんなものかがわかるようにしたものですので、ご了承ください。
帰無仮説と対立仮説
医学の世界では、新薬の有効性を調べる、などの研究を行う際、新薬を投与した群と偽薬を投与した群とで結果がどう異なるかを調べて評価するわけですが、両群で見られた結果の差が「偶然起こった差ではないだろう」ということを評価するために、仮説検定という立場をとります。簡単にするため、以下は新薬投与群と偽薬投与群という2群に対する評価を行う場合について書いていきます。新薬投与群と偽薬投与群で、仮に新薬投与群の方が良い結果となる人の割合が高かったとします。その割合の違いは、新薬が本当に有効なので起こった違いなのでしょうか?それとも、同じ程度だけど単なる誤差として起こったことでしょうか?
仮説検定では、「新薬と偽薬に差はない(=両群の結果の差は偶然で違いはない)」という帰無仮説を仮定した上で、今回起こった出来事が偶然の産物かどうかを確認し、偶然ではなさそう、と判断できれば、帰無仮説を棄却し、対立仮説「新薬と偽薬に差がある(=両群の結果の差は偶然ではなく違いがある)」が支持されると判断します。
p値は帰無仮説下でその出来事(+よりレアなこと)が起こる確率
では、「今回起こった出来事が偶然の産物ではなさそう」と確認するにはどうすればいいか、それが統計になります。統計解析の結果出てくるp値は、「帰無仮説が正しいと考えたときに、今回のような差が出るという出来事が起こる確率」になります。
つまり、新薬と偽薬の効果が同じだったとすれば、本来は差のない結果が出るはずだが、今回のような差が出る確率はどの程度か、を表すのがp値です。そして、「p値が0.05未満である」ということは、「新薬と偽薬に差がないとすれば、今回のような差が生じるのは、100回に5回も起きない珍しいこと」という意味を持つため、「帰無仮説より対立仮説が正しいと考えた方が合理的」と判断し、「新薬と偽薬の効果には統計学的に有意差がある」とするわけです。
この時、p値がどの程度小さければ有意差があるとするかの閾値(有意水準)は、研究デザインなどによってことなり、0.05や0.01が使われるのが一般的です。
高校数学で語るp値-このコインはイカサマコインか?
では、このp値を高校数学で簡単に調べられる例で、仮説検定をして見たいと思います。あるコインを10回投げたところ、表が2回、裏が8回出るという結果になった。このコインは裏の出やすいイカサマコインか? |
これを仮説検定して見ましょう。
帰無仮説:このコインはイカサマコインではない(=確率0.5でそれぞれ表裏が出る) |
では、今回のp値を調べてみたいと思います。p値は、「帰無仮説の下で、今回の結果+より珍しい結果の起こる確率」と考える必要があることです。つまり、この例でのp値は「10回中表が2以下しか出ない、または裏が2回以下しか出ない」という状況の確率になります。
これは高校数学レベルで求めることができる確率ですね。
p=2×(10C2+10C1+10C0)×(0.5)10=0.1093 |
ということで、p値が0.05を下回りませんでした。10回中2回しか表が出ない、というのは、普通のコインでも10%以上とそこそこ起こることなので、このコインはイカサマコインとは言えないわけですね。
ちょっと息切れしてきたので、後編に続く・・・
関連記事
高校数学で語るp値(後編)この記事の後編です。p値の注意点と効果量、サンプルサイズについてまとめてみました。
この記事へのコメント