Hazy Ideas

日々の勉強の気づきを書き出しています

交絡因子と調整因子の違い

疫学において、

  • 飲酒者と肺がん発症に関連がみられる(実際には、飲酒習慣がある人に喫煙者が多いことが要因)
  • コーヒー引用習慣がある人に心筋梗塞発症に関連がみられる(実際には、コーヒー引用習慣がある人に喫煙者が多いことが要因)

のような事象が見られることがあります。実際には関連がないのに、分析結果で関連があるようにみえることを、交絡と呼びます。

調べていくと、「交絡因子」と「調整因子」で呼び方が異なることがあります。違いはあるのでしょうか。

交絡因子とは

冒頭の内容と被りますが、アウトカム(疾病発症や検査結果など)と曝露の関係に影響を及ぼすような別の影響のことを、交絡因子confounding factorと呼びます。疫学研究において、交絡因子を完全に排除することは難しいですが、可能な限りは交絡因子を検討・考慮する必要があります。ここでは詳しくは触れませんが、交絡因子の対処方法が適切である研究方法の方が、疫学研究としての妥当性が高い(より信頼性の高いデータとして認識される)と言われます。妥当性について大雑把には、ランダム化比較試験>コホート研究>症例対照研究>生態学的研究というような順番です。

調整因子とは

交絡の要因になる因子に見当がついた場合、その影響を取り除いて解析する必要があり、これを調整adjustmentと呼びます。

調整の方法にはいくつかあります。解析対象を制限する(例:禁煙者に絞る)、マッチングする(例:症例と対照で性別・年齢などの要素を合わせて対象者を選ぶ)、階層化する(例:年齢を10代ごとにわける)、重み付けする(例:症例と対照で喫煙者の割合が合うように数字を補正する)、モデルに組み込む(大変量解析モデルの因子に加えることで、因子ごとの影響をみる)などです。

調整因子を検討する

交絡の因果関係を考えるうえで、DAG(Directed Acyclic Graph)と呼ばれる方法があります。これはたくさんの変数がある場合に、変数間の関係を医学的な知見から矢印で方向をつけて可視化することで、何で調整すべきか(過剰調整もよくない)検討するものです。

生物系の分野だと、関連のありそうな自然のデータを全部組み込んで、AIC赤池情報基準)などを用いてベストモデルを決めるということをします。疫学の分野ではAICを使う文献は少なく、医学的知見から著者らが研究ごとに調整因子を決めているという印象です。

まとめ

考えられる交絡因子の中から、測定可能かつ関連がありそうな因子を調整する(調整因子)という関係性であることがわかりました。文献を読むうえでは、(検討した)交絡因子と調整因子はほとんど同じものと考えてもよさそうです。