このシリーズでは、論文などで目にする医学研究データを正しく評価できるように、わかりやすく解説していきます。講師は、統計解析の専門家である菅 民郎氏(株式会社アイスタット 代表取締役会長 / ビジネス・ブレークスルー大学院大学 教授 / 理学博士)。
第3回 理解しておきたい検定
セクション10 p値による仮説検定
セクション9では、t値による仮説検定の手順と棄却限界値について学習しました。セクション10では、p値による仮説検定について学んでいきます。
■p値とは何か
セクション4の「仮説検定の手順 (4)比較する」で、下記の3つの方法を学びました。
- 方法1
- 信頼区間の下限値と上限値の符号(+/-)を比較
(信頼区間の範囲は0(ゼロ)を「またがる・挟む」の判断)
- 方法2
- t値と棄却限界値を比較
- 方法3
- p値と有意点を比較(よく用いられる有意点は0.05 )
このセクションでは、「方法3 p値と有意点を比較」をご説明します。
これは、仮説検定をp値で行う方法です。また、p値をマスターすることは必須です。
なぜp値のマスターが必須であるかというと、医学論文で仮説検定を行う方法としてよく用いられるのが、このp値だからです。p値は、セクション9で学んだ信頼区間、t値とほぼ同じです。
表29はセクション9の表27と表28をまとめて示したものです。
表29 信頼区間、t値
Aは有意差がある、Cは有意差があるといえない、Bはその中間となります。
p値は、Bのように下限値が0の場合はp=0.05となります。そして、Aはp値が0.05より小さい値、Cはp値が0.05より大きい値になるように求められるのです。それだけなのですが、p値についてきちんと説明していきましょう。
■p値とは
- 「p値」とはprobability(確率)の頭文字です。pの値は0~1の間の値で、pが小さいほど比較対象間(新薬Yの投与前体温平均値と投与後体温平均値)に差がある確率が高くなる。
- p値は、統計学が定めた基準0.05(有意点という)より小さければ、帰無仮説を棄却し、対立仮説を採択する。つまり「有意差がある」「解熱効果がある」といえる。
- p値が0.05より大きければ、帰無仮説を棄却できず、対立仮説を採択できない。つまり「有意差があるといえない」「解熱効果があるといえない」といえる。
- 求められたp値は、次のように表記する。
たとえばp値が0.02の場合、p=0.02<0.05、あるいはp<0.05と表記する。
この表記で「有意差がある」ことが一目でわかる。
p値が0.4の場合、p=0.4>0.05 あるいはp>0.05と表記する。
この表記で「有意差があるとはいえない」ことが一目でわかる。
表30でp値を求めてみましょう。
p値は、Excel関数の「TDIST」を使用して算出できます。
表30 p値の算出
このようにt値とp値は逆になります。
つまり、t値は大きいほど、p値は小さいほど「有意差がある」といえるのです。
■p値による仮説検定
表30のA、Cの値を用いて、仮説検定をしてみましょう。
- 帰無仮説
- 低下体温は投与前体温から投与後体温を引いた値なので、投与前体温平均値と投与後体温平均値は等しい。
- 対立仮説
- 投与前体温平均値と投与後体温平均値は異なる。
投与前体温平均値が投与後体温平均値より高く、母集団においてAは解熱効果がある。
- Aの判定
- p値=0.00<0.05
「等しい」という仮説を棄却し、「異なる」という対立仮説を採択する。
母集団において、Aは信頼度95%で解熱効果があるといえる。
- Cの判定
- p値=0.43>0.05
「等しい」という仮説を棄却できず、「異なる」という対立仮説を採択しない。
母集団において、Bは信頼度95%で解熱効果があるとはいえない。
- Bの判定
- p値=0.05
Cの判定と同じにするのが一般的です。
■p値の応用
p値と有意点0.05との比較で有意差判定をしましたが、p値そのものを使って解釈することも、もちろん可能です。
p=0.02を例に解釈してみましょう。
対立仮説を採択した場合、母集団における信頼度は98%になります。採択した判断が間違いかもしれませんが、その間違う確率はわずか2%だということになります。
次に、p=0.3を解釈してみましょう。
対立仮説を採択した場合、母集団における信頼度は70%となりますね。採択した判断が間違いかもしれませんが、その間違う確率は30%となります。
解釈としては、そのままですが、間違う確率30%が基準の0.05(5%)を大きく上回っているので、母集団において「有意差があるとはいえない」と判断できるのです。
■対応のあるt検定
ここまでの道のりはとても遠いものでしたが、「対応のあるデータ」に信頼区間、t値、p値を用いて仮説検証を行う方法を「対応のあるt検定(paired t-test)」といいます。
■今回のポイント
- 1)p値とはprobability(確率)の頭文字。pの値は0~1の間の値で、p値が小さいほど比較対象間(例:新薬Yの投与前体温平均値と投与後体温平均値)に差がある確率が高くなる。
- 2)p値は、統計学が定めた基準0.05(=有意点〔有意水準〕)より小さければ、「有意差がある」、今回のケースでは「解熱効果がある」といえる。
- 3)p値が0.05より大きければ、「有意差があるといえない」、今回のケースでは「解熱効果があるといえない」という。
- 4)求められたp値は次のように表記する。
たとえばp値が0.02の場合、p=0.02<0.05、あるいは、p<0.05 と表記する。
この表記で「有意差がある」ことが一目でわかる。
p値が0.4の場合、p=0.4>0.05あるいはp>0.05と表記する。
菅 民郎 ( かん たみお ) 氏株式会社アイスタット 代表取締役会長ビジネス・ブレークスルー大学院大学 教授(理学博士)
バックナンバー
第4回 ギモンを解決! 一問一答
第3回 理解しておきたい検定
第2回 リスク比(相対危険度)とオッズ比
第1回 カプランマイヤー法で生存率を評価する