Modern Epidemiology Chap 2 “Causation and Causal Inference” part 1

Twitterで集まった臨床医、国内外のMPH生、Public healthの専門家たちとオンラインでModern Epidemiologyを読む会を毎週1回ずつ行っているのですが、やはり各章一度ずつ読んだだけでは理解に乏しい部分もあり、改めて読み直すことにしました。

Modern Epidemiologyを知らない方のために説明すると、これは世界的な疫学者であるRothmanらが執筆した疫学の金字塔的な書籍であり、世界中の疫学徒により読まれています。しかし、その難解さに定評がありまして、「アメリカ人が英語で読んでも混乱する」と言われるほど。残念ながら日本語には翻訳されておらず、またこれまでModern Epiを解説した大衆向けのブログや動画がなく、そのため疫学を学ぶ人にとっても(ましてや看護師にとってはなおのこと)近寄りがたい書籍だったのだろうと推測しております。

そんな中でせっかく仲間と一緒にModern Epiを読んでいるのだから、これから読む方のためにもブログに要点をまとめていこうと思いたちました。Modern Epiにずらぁっと書かれている細々とした計算までブログに書こうとすると、とてもじゃないけれど書ききる自信がないので、このブログでは計算過程は省いて、疫学を行なう上で知っておくべきだと思われた記述をコンセプチュアルに解説していこうと思います(そういった記述を正しく理解するためには、計算過程を丁寧に理解する必要があると思いますので、深い理解を求める方はぜひ原著をお読みください)。

 

なお、Modern Epidemiologyを読む会の様子は毎回動画にしているので、「Modern Epi勉強したいけど、一人だとちょっと」という方はぜひご覧ください。

 

さて、今回のブログではModern Epidemiology Chapter 2の”Causation and Causal Inference”の要点をまとめていきます。Modern Epiの根幹をなす「因果関係とは何か」が説明されているチャプターになります。

 

 

Component cause modelについて

まず、Modern Epidemiologyにおいては疾病が発生する原因を「疾病の発生に先んじたイベント、状態、特性であり、もしそれらが異なるものであったなら疾病は一切発生しなかったであろう、もしくはある時間までは発生しなかったであろうもの*」と定義しています
*私の訳ですので、各人で原著を確認してください。

 

Modern Epidemiogyではとある疾病の原因を視覚的に捉えやすくするために、component cause modelというグラフが使われます。これは下の図で表現されるように、疾病が発生するために必要な原因群から構成された円グラフです。

 

Figure 1. Component cause model

 

例えば、「転倒による臀部の骨折」という疾病が発生するためには、①氷の上を歩いた、②その日の天候、③道が見えにくかった、④靴の選択が悪かった、⑤手すりがなかった、などと幾つかの要因が重なる必要がある、という例が原著にてあげられています。

 

ここで新たに用語が登場しますが、sufficient causeとは「疾病が発生するのに必要な最低限の状態やイベント群で、完全な因果メカニズム」のことを指します。また、この時大切なのはcomponent cause modelには必ず未知の因子群であるU (Unknown factors)が含まれているということです。これは、たとえどれだけ研究を積み重ねていったとしても、「疾病の原因を考えるうえでは、我々には知り得ていない多くの未知の状態やイベント群が常にある」という仮定を重要視しているが故です。

さて、疾病が発生するためには、例を出すと、「転倒により骨折するためには」sufficient causeはすべて漏れなく出揃わなくてはなりません。逆に言えば、上にあげた5つの原因のどれかをブロックしてしまえば、因果のパスを閉じるということができるということです。再び例に戻れば、「道を明るくして見えやすくする」もしくは「手すりをつける」ことさえすれば、転倒による骨折を防げるということになりますね。

 

 

次に、necessary causeという用語について説明します。

疾病Aに対してはただ一つのcomponent cause modelのみあるわけではなく、幾つかのモデルが存在するとしましょう。この時、どのcomponent cause modelにも登場する因子がnecessary causeと呼ばれます。これは文字通り、どのような因果モデルであったとしても、疾病Aを発生させるうえでは必要不可欠な因子という意味です。

 

例えば、疾病Aとして先に挙げた臀部の骨折を考えてみましょう。

既に説明されている「氷の上での転倒」以外にも、「喧嘩でお尻を蹴られる」、「交通事故にあう」などと臀部の骨折を発生させるcomponent cause modelは複数存在します。しかしながら、臀部の骨折が発生させるためには、これらのモデル全てに共通して存在していないといけない因子、つまりnecessary causeがあります。やや極端に聞こえるかもしれませんが、それは「お尻がある」という因子です。

 

 

次に登場する用語が、complementary component causesというものです。complementaryとは、「補完的な」などの意味を持った形容詞です。これは、sufficient causeにおいてある一つのcomponent causeを選択した時に、それ以外のcauseのまとまりを意味しています。Figure 1のcomponent cause modelですと、component cause AはB、C、D、Uというcomplementary component causesを持つことになりますね。

 

 

 

特定のReferenceを正しく設定する必要性について

因果推論において原因を考える際には、原因そのものだけでなく「原因が起こっていない状態」を正しく定義する必要があります

例えば、介入試験によって「チーズ摂取が小児においてアレルギーを発生させるかどうか」を調べたいとしましょう。この時、非介入群をどう定義するかによってチーズ摂取が小児のアレルギー発生に与える因果効果は変わってきます。非介入群に「いかなる乳製品も食べさせない」という介入を行なえば、チーズ摂取群においてはアレルギー発症率が高くなり、「チーズ摂取は、非乳製品摂取と比較して小児におけるアレルギー発症率をあげる」と結論されるでしょう。一方で、非介入群に「チーズではなく牛乳を摂取させる」という介入を行えば、チーズ摂取群でも非チーズ摂取群でも同様のアレルギー発症率となり、「チーズ摂取は、非チーズ摂取と比較して小児におけるアレルギー発症率をあげない」と結論されるかもしれません。

このように、ある原因が結果に影響するかどうかは「原因が起こっていない状態」をどう定義するかによって変化するために、因果推論においては「原因を起こっていない状態」を正しく定義する必要があります。

 

この時大切なのが、現実的なreferenceを設定するということです。

例えば、降圧薬Aが消化管出血を増加させるかどうかを研究する際に、referenceとしてプラセボ投与を設定するのは臨床的には現実的ではありません。なぜなら、降圧薬を内服している方は、血圧を下げる必要があるから降圧薬を内服しているのであって、「消化管出血が起こるかもしれないから降圧薬を内服しないでもらう」というのは実臨床のプラクティスでは起こりえない判断だからです。ですので、この例では「降圧薬Aの代わりに同じ程度の降圧効果があると知られている降圧薬Bを内服する」というのがreferenceとしてより現実的な選択になります。

Modern Epidemiologyに書かれていたものではありませんが、この記述からは「データサイエンスのテクニックがあるだけでは正しい因果推論を行なうことができない」ということが分かるかと思います。再び例に戻りますと、「降圧薬Aの代わりにプラセボを選択することが、実臨床的に行いうるプラクティスかどうか」というのは、実際に臨床経験のある医療者でないと判断することが難しいでしょう。ですので、因果推論を行なおうとする際には自身でその分野のドメイン知識を身につける、もしくはそれを持っている専門家とチームを組むということが重要になってくるのだと思いました。

 

 

 

Induction periodとLatent periodについて

今回紹介したcomponent cause modelの弱点は、モデルからは時間関係を知ることができないということです。Figure 1ではcomponent causeのA~Uが同一平面に描かれていましたが、実際にはAが起きて、Bが起きて、Cが起きて、Dが起きて、Uが起きて、そして最後にEが起きて、その後数時間たってからイベントが発生する(つまり原因から結果が起こる)というような時間の流れが存在しています。

この時、sufficient causeを満たすのに必要なcomponent causeであるEが発生してから、実際にイベントが発生するまでの時間を、component cause Eにおけるinduction period(誘導期間)と呼びます。

Induction periodの長さは対象となるイベントによって様々で、例えば「component cause: 電気のスイッチを押す、イベント: 電気がつく」というモデルではinductuion periodはゼロに近いでしょうし、「component cause: 被曝する、イベント: 白血病の発症」というモデルではinduction peridoは数年から数十年にもなります。

 

大切なことは、「疾病そのものが長い、もしくは短いinduction periodを持つ」と定義するのは間違いだということです。なぜなら、induction periodとはcomponent cause modelの中の一つのcomponent causeとイベント発生までの期間であるので、例えばcomponent cause A~イベントまでのinduction periodが10年だったとしても、component cause E~イベントまでのinduction periodは≒ゼロかもしれません。

ですので、Modern Epiの定義に素直に従うならば、「癌は発症までに長い時間を要する病気である」という記述は誤りということになりますね。こうした誤った記述は、研究者に対して「癌発症というイベントにおいて、時間的に後方で発生するcomponent causeを無視させる」というミスリーディングに繋がりかねません。

 

Induction periodと似たような言葉で、latent period(潜伏期間)という言葉があります。研究者によっては両者を同一に扱う方もいらっしゃるようですが、Rothmanらは明確に使い分けると述べています。Induction periodが「疾病のとある原因の内の一つであるAが生じてから、疾病が起こるまでの時間」であり、一方でlatent periodは「疾病が起こってから発見されるまでの時間」と定義されます。ですので、latent periodは例えばスクリーニング検査の精度向上により短くすることができますが、induction periodはそういった介入をしても短くなることはありません。そもそも疾病が発生していないのですから、スクリーニングによって見つけることはできませんね。

 

 

 

以上が、chapter 2のpart 1になります。

当初はchapter丸々を扱う予定だったのですが、ボリュームが大きくなってしまって(私が)辛かったので、partにしていくことにしました。

 

なお、「Modern Epiを読む会」では本Chapterの解説を動画にしております。「Modern Epiを全て読み込んでる時間なんてないよ」という方は、そちらもご覧ください。

      

広告