ソース: https://discourse.datamethods.org/t/the-petty-bone-rct/22077 前半
COVID-19パンデミックの初期、世界中の集中治療室(ICU)は未曾有の危機に直面した。確立されていたはずの急性呼吸窮迫症候群(ARDS)に対する人工呼吸器ガイドラインは機能的に崩壊し、その科学的妥当性を失い、多くの患者が命を落とした。この悲劇は、単なる新興感染症に対する不測の事態ではなく、集中治療(クリティカルケア)領域の研究手法の設計そのものに起因する、予測された失敗であった。それは、数十年間にわたり根を張ってきた、より根深い構造的欠陥が白日の下に晒された瞬間だったのである。
本レポートの目的は、この問題の核心にある研究手法、すなわち「ペティ・ボーンRCT」の構造的欠陥を分析することにある。特に、COVID-19肺炎という単一疾患に対して、多様な病態を内包するARDSのガイドラインを画一的に適用した結果、いかにして悲劇が引き起こされたのかを、その因果関係と共に解明する。
この分析を通じて、本レポートは単に過去の失敗を糾弾するのではなく、臨床研究が本来あるべき姿、すなわち科学的妥当性と再現性に根差した、より信頼性の高い研究パラダイムへの回帰を提言する。
臨床研究の妥当性を評価するためには、その設計思想の根幹を理解することが不可欠である。ここでは、科学的真理の探求を目指す理想的なランダム化比較試験(RCT)と、実用性を優先するあまりその本質から逸脱してしまった手法という、二つの対照的なパラダイムを解説する。
臨床試験の理想的なモデルは、1948年にオースティン・ブラッドフォード・ヒルが実施したストレプトマイシンによる肺結核治療のRCTに見ることができる。この研究が今なおゴールドスタンダードと見なされるのは、その厳格な科学的原則に基づいているからである。
ブラッドフォード・ヒルRCTが科学的に妥当とされる理由は、以下の諸点に要約される。
- 単一疾患への焦点: 治療法の効果を検証する対象を、「単一の、明確に定義された疾患」に限定する。ヒルは、進行度が異なる肺結核の中から、治療効果を客観的に評価できる特定の病期、すなわち「上葉の肺胞性病変」を持つ患者のみを対象とした。
- 均質な研究集団: 研究対象となる患者の病態を揃えることで、結果に影響を与えうる交絡因子を最小限に抑え、治療法そのものの効果を純粋に測定することを可能にする。
- 再現性の確保: この厳密なアプローチは、異なる研究者が同じ条件で試験を行った際に、同様の結果が得られるという科学の基本原則である「再現性」を担保する。
ブラッドフォード・ヒルの原則から逸脱し、「病的科学(pathological science)」とも評される改変が、トーマス・ペティの着想(1960年代)とロジャー・ボーンによる手法開発(1980年代)を経て確立された「ペティ・ボーンRCT」である。これは、臨床研究における一種の「ショートカット」と言える。
この手法の核心は「ランピング(lumping、ひとまとめにすること)」にある。具体的には、原因が全く異なる複数の疾患を、非特異的な検査値やバイタルサインの閾値に基づいて、「異種混合シンドローム(heterogenous syndrome)」として一括りにしてしまうのである。この手法は、明確な診断を必要とせず、基準を満たす患者を機械的に集めることができるため、「症例発見の容易さ」という実利的なメリットから、過去約35年以上にわたり集中治療領域の研究の標準となった。
しかし、この実用性重視の「ショートカット」は、科学的妥当性を著しく損なう根本的な欠陥を内包していた。そしてその欠陥が、後のパンデミックにおいてガイドラインの破綻という形で顕在化することになるのである。
長年にわたり見過ごされてきたペティ・ボーンRCTの構造的欠陥は、COVID-19という未曽有のパンデミックによって、誰の目にも明らかな形で露呈した。このセクションでは、理論上の問題が、いかにして現実世界での悲劇に直結したのかを分析する。
パンデミック初期、重症化したCOVID-19肺炎患者の多くは、既存の「ARDS」の診断基準を満たした。この基準は、特定の疾患を指すものではなく、様々な原因による重度の肺損傷を示す非特異的な臨床指標の集合体(閾値セット)に過ぎない。
その結果、ペティ・ボーンRCTに基づいて作成されたARDS用の標準化された人工呼吸器プロトコルが、「エビデンスに基づく医療」という名の下に、COVID-19肺炎患者へ画一的に適用される事態となった。これは、全く異なる原因を持つ疾患を同じ「シンドローム」として扱ってしまう、ペティ・ボーンRCTの論理的帰結であった。
この画一的なARDSガイドラインの適用は、悲劇的な結果をもたらした。COVID-19という特定のウイルス性肺炎に対して、汎用的なプロトコルを適用した結果、一部の地域では人工呼吸器を装着した患者の死亡率が最大80%に達したと報告されている。
この惨状を目の当たりにした現場の臨床医たちは、ガイドラインに従うことがかえって患者に害を及ぼしていると判断し、それを放棄せざるを得なくなった。これは後に「2020年の集中治療での反乱 (critical care revolt)」として知られるようになる。この出来事は、ペティ・ボーンRCTから生まれた「ワンサイズ・フィッツ・オール(one-size-fits-all)」のアプローチが、特定の疾患に対しては無効であるばかりか、有害にすらなり得ることを証明する決定的な事例となった。
では、なぜこのような失敗が必然的に起こったのか。その背後にある、より深い因果関係のメカニズムを次に解き明かす。
ペティ・ボーンRCTの失敗は偶然ではない。その研究デザイン自体に、統計的・因果推論的に見て、必然的に失敗する運命にある根本的な欠陥が組み込まれている。このセクションでは、そのメカニズムを解明する。
ペティ・ボーンRCTの最大の問題点は、ARDSのような「シンドローム」を、あたかも単一の疾患であるかのように扱ってしまう点にある。しかし、ARDSは単一の病気ではない。それは多様な原因から生じる、肺損傷という共通の 結果(outcome) の集合体に過ぎない。
例えば、ある研究で「ARDS」と診断された90症例の内訳を見ると、以下のように多岐にわたる。
- 全身性感染症(敗血症)に伴う肺損傷:35例
- COVID-19肺炎:25例
- インフルエンザA肺炎:10例
- 誤嚥性肺炎:5例
- 重度熱傷に伴う肺損傷:5例
- 膵炎に伴う肺損傷:5例
これらの根本原因が異なれば、病態生理も異なり、当然ながら特定の治療法への反応も全く異なってくる。これは臨床上の自明の理である。異なる病気に同じ治療を施して、一貫した結果を期待することはできない。
ペティ・ボーンRCTは、因果関係を探求するという科学の基本目的において致命的な欠陥を抱えている。この手法は、ARDSという「結果」に基づいて患者群を形成する。しかし、治療効果に真に影響を与えるのは、その背景にある個々の「原因」(真の疾患)である。「ランピング(ひとまとめにすること)」は、この重要な原因と結果の連鎖を見えなくしてしまうのだ。
この手法では、研究ごとに対象となる患者群の「疾患ミックス(症例の内訳)」が変動する。そのため、研究から得られる「平均治療効果(Average Treatment Effect, ATE)」は、その研究で偶然集まった疾患の組み合わせに完全に依存するため、全く意味をなさなくなる。この「疾患ミックス」という未知の交絡因子が結果を支配するため、再現性の欠如は偶然の産物ではなく、研究デザインから必然的に導かれる数学的な帰結なのである。
この問題点をより分かりやすく理解するために、架空のシンドローム「敗血症性咽頭炎(Septic Throat)」というアナロジーが有効である。
- 症候群の定義: まず、「白血球数が12,000以上」かつ「発赤を伴う咽頭痛」といった基準で、「敗血症性咽頭炎」というシンドロームを定義する。
- 内包される疾患: この基準を満たす患者の中には、A群レンサ球菌(ペニシリンが著効)、EBウイルス(伝染性単核球症)、インフルエンザウイルスなど、原因となる病原体が全く異なる様々な疾患が含まれる。
- 研究結果のばらつき: この「敗血症性咽頭炎」に対してペニシリンの効果を検証するRCTを行うとどうなるか。単一の施設で行われた研究で、偶然A群レンサ球菌の患者の割合が高ければ、ペニシリンは「有効」という結果が出るだろう。しかし、多施設共同研究で様々な病原体の患者が含まれると、ペニシリンが効かない大多数の患者によって効果が「希釈」され、結果は「無効」となる。
これが、再現性の低さの根本原因である。ペティ・ボーンRCTは、疾患ではなくシンドロームを対象とすることで、本質的にこのような不安定な結果しか生み出せない。この手法の欠陥は、より広範な研究文化そのものの問題へと繋がっていく。
ペティ・ボーンRCTの問題は、単なる一研究手法の技術的な誤りにとどまらない。それは、集中治療研究の分野全体に蔓延する、より大きな構造的・文化的な危機を象徴している。
前述の「敗血症性咽頭炎」のアナロジーが示すように、単一施設研究では偶然特定の疾患(治療反応群)の割合が高まることで偽の陽性結果が生まれやすいが、多施設研究ではその効果が多様な非反応群によって希釈されるため、この驚異的な再現性の低さは予測可能であった。事実、衝撃的なデータがこの危機の実態を明らかにしている。集中治療領域において、肯定的な結果が出た単一施設のRCTのうち、その後の追試で再現性が確認されたのは、わずか6%であったと報告されている。
この驚異的な低さは、異なる疾患をひとまとめにするペティ・ボーンRCTという手法の必然的な帰結である。さらに深刻なのは、これらの再現性のない誤った研究結果に基づいて作成された臨床ガイドラインが、時に10年以上にわたって改訂されないまま放置され、患者に潜在的な危害を与え続けてきたという事実である。
これほど明白な問題が、なぜ長年にわたって放置されてきたのか。その背景には、科学の自己修正プロセスを妨げる、根深い制度的要因、すなわち「ドグマの失速(dogma stall)」が存在する。
- 研究者の「知的植民地化」: 若い世代の研究者が、この欠陥のある方法論を唯一の科学的真理として教え込まれる「知的植民地化」とも言える状況が、批判的な視点を奪い、ドグマを再生産している。
- 助成金の流れ: 研究助成金を獲得するためには、SEPSIS-3のような確立された(しかし欠陥のある)方法論に従うことが事実上強制されている。これにより、研究者はドグマから逸脱することが極めて困難になっている。
- 専門家の「保護的な沈黙」: 専門家コミュニティは、この手法の妥当性に関する公の場での議論を避け、批判に対して「保護的な沈黙」を貫く傾向がある。自らが長年依拠してきた方法論の根本的な欠陥を認めることは、専門家としての権威を揺るがしかねないためである。
このような根深いドグマが、科学に不可欠な自己修正プロセスを機能不全に陥らせている。この状況を打破するためには、具体的な改革への道筋を示す必要がある。
COVID-19パンデミックにおける人工呼吸器ガイドラインの劇的な破綻は、単なる不運な出来事ではなかった。それは、原因の異なる疾患を「異種混合シンドローム」として一括りにし、治療効果を検証するという、「ペティ・ボーンRCT」という根本的に欠陥のある研究手法が引き起こした必然的な結果であった。この手法は、再現性のない研究を量産し、患者に害を及ぼす可能性のある誤ったガイドラインを生み出す温床となってきた。
改革への道は明確である。それは、過去数十年にわたる集中治療研究のドグマと決別し、「単一の疾患に対して単一の治療法を検証する」というブラッドフォード・ヒルの基本原則に立ち返ることである。改革の目的は、臨床研究のゴールドスタンダードであるRCTそのものを放棄することではない。むしろ、その信頼性を著しく損なう「ペティ・ボーン」という病的改変を排除し、RCTを本来の科学的厳密性へと回帰させることにある。
患者を救う有効な治療法を見出すための第一歩は、テクノロジーや統計手法の洗練だけではない。まず対象となる「疾患」を正確に診断し、その病態を深く理解することから始まる。科学と医療のこの原点を再確認することこそが、未来の患者を救うための唯一の道なのである。