わかる統計教室

536 views
Skip to first unread message

鴨下賢一

unread,
Feb 21, 2017, 6:59:46 PM2/21/17
to 静岡発達SIGの新しいML

わかる統計教室 第3回 理解しておきたい検定 セクション10

  • 公開日:2016/05/23

このシリーズでは、論文などで目にする医学研究データを正しく評価できるように、わかりやすく解説していきます。講師は、統計解析の専門家である菅 民郎氏(株式会社アイスタット 代表取締役会長 / ビジネス・ブレークスルー大学院大学 教授 / 理学博士)。

第3回 理解しておきたい検定

セクション10 p値による仮説検定

セクション9では、t値による仮説検定の手順と棄却限界値について学習しました。セクション10では、p値による仮説検定について学んでいきます。

■p値とは何か

セクション4の「仮説検定の手順 (4)比較する」で、下記の3つの方法を学びました。

方法1
信頼区間の下限値と上限値の符号(+/-)を比較
(信頼区間の範囲は0(ゼロ)を「またがる・挟む」の判断)
方法2
t値と棄却限界値を比較
方法3
p値と有意点を比較(よく用いられる有意点は0.05 )

このセクションでは、「方法3 p値と有意点を比較」をご説明します。

これは、仮説検定をp値で行う方法です。また、p値をマスターすることは必須です。

なぜp値のマスターが必須であるかというと、医学論文で仮説検定を行う方法としてよく用いられるのが、このp値だからです。p値は、セクション9で学んだ信頼区間、t値とほぼ同じです。

表29はセクション9の表27と表28をまとめて示したものです。

表29 信頼区間、t値

表29 信頼区間、t値

Aは有意差がある、Cは有意差があるといえない、Bはその中間となります。

p値は、Bのように下限値が0の場合はp=0.05となります。そして、Aはp値が0.05より小さい値、Cはp値が0.05より大きい値になるように求められるのです。それだけなのですが、p値についてきちんと説明していきましょう。

■p値とは

  • 「p値」とはprobability(確率)の頭文字です。pの値は0~1の間の値で、pが小さいほど比較対象間(新薬Yの投与前体温平均値と投与後体温平均値)に差がある確率が高くなる。
  • p値は、統計学が定めた基準0.05(有意点という)より小さければ、帰無仮説を棄却し、対立仮説を採択する。つまり「有意差がある」「解熱効果がある」といえる。
  • p値が0.05より大きければ、帰無仮説を棄却できず、対立仮説を採択できない。つまり「有意差があるといえない」「解熱効果があるといえない」といえる。
  • 求められたp値は、次のように表記する。
    たとえばp値が0.02の場合、p=0.02<0.05、あるいはp<0.05と表記する。
    この表記で「有意差がある」ことが一目でわかる。
    p値が0.4の場合、p=0.4>0.05 あるいはp>0.05と表記する。
    この表記で「有意差があるとはいえない」ことが一目でわかる。

表30でp値を求めてみましょう。

p値は、Excel関数の「TDIST」を使用して算出できます。

表30 p値の算出

表30 p値の算出

このようにt値とp値は逆になります。

つまり、t値は大きいほど、p値は小さいほど「有意差がある」といえるのです。

■p値による仮説検定

表30のA、Cの値を用いて、仮説検定をしてみましょう。

帰無仮説
低下体温は投与前体温から投与後体温を引いた値なので、投与前体温平均値と投与後体温平均値は等しい。
対立仮説
投与前体温平均値と投与後体温平均値は異なる。
投与前体温平均値が投与後体温平均値より高く、母集団においてAは解熱効果がある。
Aの判定
p値=0.00<0.05
「等しい」という仮説を棄却し、「異なる」という対立仮説を採択する。
母集団において、Aは信頼度95%で解熱効果があるといえる。
Cの判定
p値=0.43>0.05
「等しい」という仮説を棄却できず、「異なる」という対立仮説を採択しない。
母集団において、Bは信頼度95%で解熱効果があるとはいえない。
Bの判定
p値=0.05
Cの判定と同じにするのが一般的です。

■p値の応用

p値と有意点0.05との比較で有意差判定をしましたが、p値そのものを使って解釈することも、もちろん可能です。

p=0.02を例に解釈してみましょう。

対立仮説を採択した場合、母集団における信頼度は98%になります。採択した判断が間違いかもしれませんが、その間違う確率はわずか2%だということになります。

次に、p=0.3を解釈してみましょう。

対立仮説を採択した場合、母集団における信頼度は70%となりますね。採択した判断が間違いかもしれませんが、その間違う確率は30%となります。

解釈としては、そのままですが、間違う確率30%が基準の0.05(5%)を大きく上回っているので、母集団において「有意差があるとはいえない」と判断できるのです。

■対応のあるt検定

ここまでの道のりはとても遠いものでしたが、「対応のあるデータ」に信頼区間、t値、p値を用いて仮説検証を行う方法を「対応のあるt検定(paired t-test)」といいます。

■今回のポイント

  • 1)p値とはprobability(確率)の頭文字。pの値は0~1の間の値で、p値が小さいほど比較対象間(例:新薬Yの投与前体温平均値と投与後体温平均値)に差がある確率が高くなる。
  • 2)p値は、統計学が定めた基準0.05(=有意点〔有意水準〕)より小さければ、「有意差がある」、今回のケースでは「解熱効果がある」といえる。
  • 3)p値が0.05より大きければ、「有意差があるといえない」、今回のケースでは「解熱効果があるといえない」という。
  • 4)求められたp値は次のように表記する。
    たとえばp値が0.02の場合、p=0.02<0.05、あるいは、p<0.05 と表記する。
    この表記で「有意差がある」ことが一目でわかる。

    p値が0.4の場合、p=0.4>0.05あるいはp>0.05と表記する。

菅 民郎 ( かん たみお ) 氏株式会社アイスタット 代表取締役会長ビジネス・ブレークスルー大学院大学 教授(理学博士)

バックナンバー
Reply all
Reply to author
Forward
0 new messages