このシリーズでは、論文などで目にする医学研究データを正しく評価できるように、わかりやすく解説していきます。講師は、統計解析の専門家である菅 民郎氏(株式会社アイスタット 代表取締役会長 / ビジネス・ブレークスルー大学院大学 教授 / 理学博士)。
今回は、3つ以上の群で、個々の群と群を検定する場合に使用される多重比較法について解説します。
あとで詳しく解説しますが、多重性とは1つの試験で、統計的検定を繰り返すことをいいます。検定を繰り返すことにより、検定を1回のみ行った場合より過誤率が大きくなってしまう、すなわち、有意差が出る可能性が高くなってしまいます。そこで、「多重比較」が必要となります。
たとえば、2標本t検定を繰り返すと有意水準が甘くなってしまうので、2標本t検定を繰り返す解析をしてはいけないのです。
今回のお話、難易度は少し高いですが、多重比較法について解説していきましょう。
■多重比較法とは
表にあるように解熱剤である製品X、Y、Zの3つの低下体温の平均の同等性を調べる場合は、「分散分析一元配置法」を用います。
「p≧0.05であれば同等」と判断し、「p<0.05であれば異なる」と判断します。
表 解熱剤の低下体温平均値
仮に得られた結論が「3つの製品の解熱剤の低下体温の評価に差がある(異なる)」としましょう。ここで出された結論から、3製品に差があることはわかりましたが、どの製品の解熱効果が優れているか、製品相互間の優劣まではわかりません。このわからないことを解決してくれるのが「多重比較法」です。
製品X、Y、Zの3製品について、製品X-製品Y、製品X-製品Z、製品Y-製品Zのすべてについて従来のt検定を行うと、それぞれについては有意水準5%で判定していても、全体としては有意水準が大きく(下記に解説する通り14.3%)なってしまいます。そのため、有意差が出やすい検定をしていることになってしまいます。
多重比較法とはどんな手法であるかを一言でいうならば、「3つ以上の群(集団)を比較する場合、有意差が『出やすくなる』のを、統計学的ルールに従って抑える検定である」といえます。
したがって、従来の母平均の差の検定を用い、製品間の差、すなわち製品Xと製品Y、製品Xと製品Z、製品Yと製品Zを順番に検定する人がいますが、上記の通り、これは正しくありません。
■有意水準が14.3%になる理由
はずれる確率が5%という、くじを引く人にとっては魅力的なくじを例に説明します。
くじを3回引いたとき、少なくとも1回は当たる確率を計算してみましょう。
確率の計算は%を小数点表示の比率にして行います。
1回のはずれる確率がわずか5%でも、そのくじを3回引いたとき、少なくとも1回はずれる確率は14.3%になります。
■3集団以上の場合、従来の母平均の差の検定を使用してはいけない理由
本題の、従来の母平均の差の検定を使用してはいけない理由を考えてみます。
製品X、Y、Zの3製品相互を比較する組み合わせは図1の3つになります。
図1 製品XY、XZ、YZの3通りの組み合わせ
各組み合わせに対し、従来の母平均の差の検定を行ってみます。
1番目の組み合わせで、XとYについて「差がある」(あるいは「差がない」)という結論が得られたとします。「その結論は正しいか」という問いに対し、統計学では「95%の自信をもって正しい」、あるいは「間違えるとしたら5%である」という回答になります(統計学では一般的な基準は5%で、この値を「有意水準」といいます)。
2番目の組み合わせ XとZ、3番目の組み合わせ YとZについても、従来の母平均の差の検定を行います。3つの組み合わせすべての検定を行ったとき、「結論が少なくとも1回間違っている確率」の問いに対し、統計学での解答はどうなるでしょうか。
先に述べた確率からおわかりのように、1つの組み合わせを間違える確率が5%(先の例でははずれる確率といっていました)なので、3回のうち、少なくとも1回間違える確率は14.3%になります。
ですから、統計学の判断基準として14.3%という値は大きすぎるので、従来の母平均の差の検定を使ってはいけないのです。
■多重比較法による有意水準の求め方
従来の母平均の差の検定を適用すると、取り扱う項目数が多くなるほど、間違える確率は大きくなっています。
項目の数がいくつになろうと、間違える確率を一定の値(有意水準といい、一般的には5%)に保つように考えられたのが「多重比較法」です。
多重比較法の有意水準の算出方法は、図2のような考え方によって算出されます。
図2 多重比較法の有意水準算出のフローチャート
多重比較法には、いろいろな種類がありますが、有意水準を求めるところでそれぞれ異なり、あとの検定方法はすべて同じとなります。図2のような考え方で有意水準を求める方法は、ボンフェローニの多重比較法といわれ、最も一般的な手法です。
■多重比較法の公式
はじめに従来の母平均の差の検定を図3に示します。
●公式 2つの母集団の母平均の差の検定(図3)
●結論
統計量の場合 T≧t(f,α/2)なら差があるといえる
p値の場合 p≦αなら差があるといえる
次に多重比較における母平均の差の検定の公式を図4示します。図3で示した公式とほとんど同じですが、有意水準の設定において違いがあります。
●公式 多重比較における母平均の差の検定(図4)
*この公式が適用できる前提条件
※母集団が正規分布かどうかわからない場合でも、多重比較法が適用できる場合がありますが、詳しくは次回の「質問6 比較する群が3つ以上ある場合の母平均の差の検定方法は?(その2)」で解説します。
●結論
統計量の場合 T≧t(n-k,α´/2)なら差があるといえる
p値の場合 p≦α´なら差があるといえる
今回は「3集団以上の場合は、従来の母平均の差の検定を使用してはいけない理由」、「多重比較法における有意水準の公式」について解説しました。次回は例題を提示し、その例題を解いていくことで、多重比較法についての理解を深めていきましょう。
従来の(2つの)母平均の差の検定については、「わかる統計教室 第3回 セクション4 仮説検定の意味と検定手順」をご参照ください。