わかる統計教室 第4回 ギモンを解決!一問一答 質問8(その1)

3,624 views
Skip to first unread message

鴨下賢一

unread,
Mar 14, 2017, 4:40:15 AM3/14/17
to 静岡発達SIGの新しいML

わかる統計教室 第4回 ギモンを解決!一問一答 質問8(その1)

  • 公開日:2017/03/13

このシリーズでは、論文などで目にする医学研究データを正しく評価できるように、わかりやすく解説していきます。講師は、統計解析の専門家である菅 民郎氏(株式会社アイスタット 代表取締役会長 / ビジネス・ブレークスルー大学院大学 教授 / 理学博士)。

第4回 ギモンを解決!一問一答

質問8 Cox比例ハザードモデルとは?(その1)

生存率の分析の手法に、カプランマイヤー法、Cox比例ハザードモデルがあります。これらの手法は、ある事象が起こった群と起こらない群の2群に対して、時間的な要素を考慮して解析する方法です。

目的変数は「アウトカム」とも呼ばれ、死亡/生存(時には、再発する/再発しない、寛解する/寛解しないなど)の2群のカテゴリーデータになります。

カプランマイヤー法について、「わかる統計教室 第1回」で詳しく説明していますので、そちらを参照ください。

■Cox比例ハザードモデル(Cox回帰モデル)

Cox比例ハザードモデルは、死亡/打ち切りのデータから生存率を求め、生存率の時間的な要素を考慮し、生存率に影響を及ぼす変数との関係式を作成する方法です。

つまり、治療法や背景因子などが生存期間に与える影響を評価する際に用います。

関係式の目的変数(アウトカム)は1、0の2値データです。1、0データは死亡/打ち切りにとどまらず、死亡/生存、再発する/再発しない、寛解する/寛解しないなど、いろいろな場面が想定されます。

説明変数は、生存率に影響を及ぼす治療方法や性別、年齢、BMIなどの背景因子が用いられます。

Cox比例ハザードモデルは、説明変数のハザード比を算出します。ハザードは危険を意味するので、生存でなく死亡に対するリスクを示す尺度です。

ハザードは、ある時点の瞬間における死亡率であり、時間とともに変化します。単位は「人/単位時間」ということになります。

下図は事例としてカプランマイヤーの生存曲線の観察データを示しています。

図 カプランマイヤーの生存曲線の観察データ

図 カプランマイヤーの生存曲線の観察データ

それでは、表1から目的変数(アウトカム)を「1:死亡、0:打ち切り」、説明変数を処方薬剤、喫煙の有無としてCox比例ハザードモデルを適用し、処方薬剤、喫煙の有無のハザード比を求めてみましょう。

  • 目的変数(アウトカム)は、死亡(再発)など危険要素を1、ほかを0とします。
  • 説明変数が2分類のカテゴリーデータの場合、死亡率が低いと仮定するほうを1、ほかを0とします。製品A、非喫煙を1としました。

表1 事例の基礎データ

表1 事例の基礎データ

■ハザード比の結果

表2に関係式の回帰係数とハザード比を示します。

表2 関係式の回帰係数とハザード比

表2 関係式の回帰係数とハザード比

ハザード比は次式によって求められる値です。

ハザード比=e回帰係数 ただし、eは自然対数の底で、2.7183…です。

【計算例】薬剤のハザード比=e-0.950=0.387 Excelの関数=EXP(-0.950)

Cox比例ハザードモデルを使って目的を解明する場合、危険度の高さを示す回帰係数でなく、ハザード比を用います。

ハザード比から、説明変数がアウトカムに対して、どれくらい寄与しているかを調べることができます。

たとえば説明変数が、「治療方法P、治療方法Q」の場合、ハザード比からアウトカム発生確率(死亡率)は、PはQに比べ何倍高いかを示せます。

また、3年間の観察期間において、アウトカムが「1:死亡、0:打ち切り」のハザード比が「1.5」だったとします。この場合の解釈は、「治療方法Pは、Qに比べ、3年の間に死亡する度合いは1.5倍高い」となります。つまり治療方法Pは、Qに比べ、良くないということです。

この例題のハザード比は「0.387」で「1」を下回りました。この場合の解釈は、アウトカム発生確率(死亡率)は、製品Aはプラセボに比べ0.387倍高いとなります。

つまり製品Aはプラセボに比べ、死亡率を61.3%(=1-0.387)減少させ、製品Aの延命効果はあったと解釈されます。

喫煙の有無のハザード比は0.480なので、非喫煙は喫煙に比べ死亡率を52.0%減少させたとなります。

次回は、ハザード比の信頼区間についてご説明いたします。

今回のポイント

  • 1)ハザード比は「1」が基準となり、「1」の場合は説明変数の値が変化しても、アウトカム発生までの時間に変化はないことを意味し、「1」より大きい場合はリスクが高くなり、「1」より小さい場合はリスクが小さくなることを表している!
  • 2)ハザード比が「1」を超えている場合は、「死亡や病状進行のリスクが対照群に比べて○○%高くなる」ということになる!
  • 3)逆に、ハザード比が「1」を超えていない場合は、「死亡や病状進行のリスクが対照群に比べて○○%低くなる」ということになる!

菅 民郎 ( かん たみお ) 氏株式会社アイスタット 代表取締役会長ビジネス・ブレークスルー大学院大学 教授(理学博士)

バックナンバー
Reply all
Reply to author
Forward
0 new messages