genkuroki/001-056.md

## 001-056.md

      
    Raw
  

              001-056.md
            
          
    ソース: https://discourse.datamethods.org/t/the-petty-bone-rct/22077

Datamethods ディスカッションフォーラム：Petty/Bone RCT に関する議論の翻訳

1. 投稿#1 (llynn)

llynn、2024年10月25日 12:23am、投稿#1
1948年にヒルがフィッシャーの教えに基づき、最初の成功したRCTを発表した際、彼は単一疾患に対する治療法を検証する必要性について、かなりの時間を割いて説明しました。
肺結核は、初期の肺胞病変から慢性の空洞性疾患へと進行します。慢性期になると、治療が成功したという目に見えるエビデンスが乏しくなります。そのためヒルは、すべての被験者が上葉の肺胞病変を有し、それによって治療反応を評価できることを求めました。
それから約20年後の1967年、ペティは異なる疾患をひとまとめにした集団に対してRCTを実施するというアイデアを提唱しました。さらにその25年後、ボーンが教示したRCTの手法を経て、あるコンセンサスグループが、非特異的な臨床検査値やバイタルサインのコンセンサスに基づく閾値によって、ペティの言う「異なる疾患をひとまとめにした集団」を定義するという考えを導入しました。これにより、コンセンサスグループはRCTにおける単一疾患の等価物を生成する方法を確立し、それを「不均一症候群（heterogenous syndrome）」と名付けました。これらの症候群に対する治療法を検証するRCTは、この新しいPetty/Bone RCTの最も一般的な実施形態となりました。
この「Petty/Bone RCT」は、過去32年間にわたりクリティカルケア領域における標準的なRCTとなりました。閾値セット（基準）によって症例をひとまとめにするこの方法は、症例発見を容易にしました。クリティカルケア領域では大規模なRCTが数多く実施されるようになりました。
しかし、私は（このフォーラムを含め）かねてから、これらは数学的に失敗せざるを得ないと予測してきました。そして実際、今年の研究で、クリティカルケア領域の単施設RCTの94%が再現不可能であり、誤ったRCTの結果が有害なガイドラインを生み出し、その後の撤回が必要になったことが明らかになりました。
https://ccforum.biomedcentral.com/articles/10.1186/s13054-023-04755-5
しかし、失敗しているのは単施設のPetty/Bone RCTだけではありません。多施設Petty/Bone RCTから導き出された最も有名なコンセンサスガイドライン（ARDSnet）はパンデミック中に機能せず、すべてのPetty/Bone RCTが信頼できる結果を提供しないことを示唆しました。
Petty/Bone RCTは、妥当なRCTなのでしょうか？ これは世界の健康にとって極めて重要な問いですが、誰もこの問いに答えようとしません。Twitter上では間違いなく沈黙が保たれています。
なぜ誰もこのトピックをPetty/Bone RCTの妥当性という根本的なレベルで公に議論しようとしないのか、私は不思議に思っています。RCT自体が神聖視されすぎて、その広く使われている派生形を批判的に分析することができないのでしょうか？ 助成金獲得という観点からの便宜性や、RCTチームの一員でありたいという願望が、あまりにも大きな推進力になっているのでしょうか？
Petty氏とBone氏のRCT手法について、どなたかご意見をお持ちでしょうか？
いいね：5件
2. 投稿#2 (S_Chakraborty)

S_Chakraborty、2024年10月25日 2:28am、投稿#2
Petty/Bone RCTという言葉を初めて耳にしましたが、医師としてまず心に浮かんだのは、疾患の定義そのものが厳密であるべきだということです。従来の解剖学的部位ではなく、分子プロファイルに基づいた試験という新しい概念も登場していますが、これらはまだ稀であり、主に特異性の高い標的治療に限られています。しかし、従来のがん領域のランダム化比較試験でさえ、同じ「種類」のがんであっても、実際には解剖学的広がり（「ステージ」と呼ばれる）や腫瘍量が非常に不均一な患者が含まれます。遺伝的・エピジェネティックな構成を考慮すれば、その不均一性はさらに増大します。この分野の試験デザインの専門家からどのようなコメントが寄せられるか、このスレッドを追っていきたいと思います。
クリティカルケアの領域では、問題の定義が異なるため、研究者は不均一な症候群を考慮する必要があるのかもしれません。例えば、これらの試験では、基礎にある疾患プロセスを実際には考慮せずに、敗血症（一連の臨床検査パラメータによって定義される）で集中治療を必要とする患者が含まれると想像します（例えば、糖尿病性ケトアシドーシスと敗血症の患者は、血液悪性腫瘍で骨髄移植を受け敗血症を発症した患者とは全く異なる管理が必要かもしれません）。臨床医として、このアプローチにはいくつかの問題があると思いますが、おそらく最も重要なのは、焦点が疾患の管理から検査値の管理へと移ってしまうことでしょう。
いいね：1件
3. 投稿#3 (R_cubed)

R_cubed、2024年10月25日 2:34pm、投稿#3
llynn:
ペティの言う、非特異的な臨床検査値やバイタルサインのコンセンサスに基づく閾値によって異なる疾患をひとまとめにした集団。これにより、コンセンサスグループはRCTにおける単一疾患の等価物を生成する方法を確立し、それを「不均一症候群（heterogenous syndrome）」と名付けました。これらの症候群に対する治療法を検証するRCTは、この新しいPetty/Bone RCTの最も一般的な実施形態となりました。
連続変数を二値化することの弊害については多くの論文で指摘されており、その一例がSCIRPに掲載された次の記事です。この記事では、二値化が最良の場合でも情報損失を招き、最悪の場合は結果の操作につながりうることが論じられています。
SCIRP：なぜ量的変数をカテゴリ変数として再コード化すべきではないのか
量的変数をカテゴリに再コード化することの欠点を発見してください。この方法がなぜ推定値の偏りやデータ分析の非効率性につながる可能性があるのかを学びましょう。情報を得て、この不適切な方法論的戦略を避けてください。
二値化は、XとYの間の関係の真の性質を見過ごすことにつながります。[6]によると、「元の分布をプロットして確認し、二値化の結果をチェックすることなく、単に連続変数を二値化することは悪い考えであり、避けるべきである」（p. 3）とされています。これら2つの例は、二値化が研究者を誤った推論に導く可能性があることを示しています。
Datamethodsの「連続変数のカテゴリ化」に関するスレッドも研究する価値があります。
いいね：1件
4. 投稿#4 (ESMD)

ESMD、2024年10月27日 2:10pm、投稿#4
腫瘍学の類推を用いることで、クリティカルケアの「症候群」を含む臨床試験における主な障害を明確にできるかもしれません。もし下記の内容が意味をなさないようでしたら、あらかじめお詫び申し上げます。その場合は無視してください。数学の方程式はずっと昔のことなので、このような考えは自分の中だけにとどめておくべきかもしれませんね…
腫瘍学において、ある治療法が内在的な有効性を持つ場合に、試験がその有効性を検出する能力（A）（つまり、試験の「アッセイ感度」）は、登録された患者のうち、問題の治療に生物学的に反応可能な腫瘍を持つ患者の割合（R）と、新しい治療法の（標準治療と比較した）内在的な有効性の差（D）に正比例し、登録された患者の（未治療時の）予後のばらつき（V）に反比例するように思われます。
A ⍺ RD/V
新しい化学療法薬（「非特異的」治療）または新しい標的薬（「特異的」治療）の内在的な治療効果を、RCTが検出する可能性を考えてみましょう。ただし、新しい治療法には内在的な有効性が存在するものとします。これらの試験における比較対照治療は、「標準治療」の化学療法とします。
以下の表は、登録される患者のタイプに応じて、RCTが新しい治療法の内在的有効性を検出できる可能性を示しています。
RCTデザイン：新規細胞傷害性化学療法 vs.「標準治療」化学療法	RCTデザイン：「標的」薬 vs.「標準治療」化学療法
試験組み入れ基準
「腺がん - 全例対象」（例：乳房、肺、結腸、膵臓）
高V - 極端な予後の不均一性（例えば、結腸腺がんと膵臓腺がんは、発見された時点で予後が大きく異なる可能性がある）。中程度のR - 化学療法の効果は、異なる腫瘍生物学を持つ患者に利益をもたらすほど広範であると見なせる。新しい化学療法薬の有効性シグナルは、登録患者間の過度の予後の不均一性によって不明瞭になる可能性が高い（試験が「ノイズ」過多になる）。ただし、新しい化学療法薬が標準治療の化学療法と比較して非常に有効である場合（つまり、高いD）は除く。	高V - 極端な予後の不均一性。Rはおそらく低いでしょう。なぜなら、特定のドライバー変異は登録患者のごく一部にしか存在しない可能性が高いためです。標的薬が高い内在的有効性を持っていたとしても、有効性シグナルは登録患者間の過度の予後の不均一性によって不明瞭になる可能性が非常に高い（試験が「ノイズ」過多になる）。ただし、問題のドライバー変異が登録患者間で比較的一般的であり、かつ標的薬が標準治療の化学療法と比較して非常に有効である場合（高いD）は除く。
腺がん、すべて同一臓器由来の腫瘍（例：肺）
「場合による」。中程度のV - 同一臓器の腺がん患者の予後は、ばらつきが少ないかもしれない（？）。中程度のR - 化学療法の効果は、異なる腫瘍生物学を持つ患者に利益をもたらすほど広範であると見なせる。新しい化学療法薬が標準治療の化学療法と比較して少なくとも中程度に有効であれば（つまり、少なくとも中程度のD）、試験は新しい化学療法薬の有効性を検出する可能性がある。	「場合による」。中程度のV - 同一臓器由来の腫瘍を持つ患者間では予後の不均一性が少ない。Rは登録患者におけるドライバー変異の有病率に依存する。試験は新しい化学療法薬の有効性を検出する可能性があるが、有効性シグナルの強さは、登録患者における関連ドライバー変異の有病率および標的薬の内在的有効性に比例する。
腺がん、任意の臓器、特定のドライバー変異あり
高V、中程度のR。試験が新しい化学療法薬の有効性を検出する可能性は低い。化学療法の効果は、異なる腫瘍生物学を持つ患者に利益をもたらすほど広範であると見なせるが、有効性シグナルは登録患者間の過度の予後の不均一性によって不明瞭になる可能性が高い（試験が「ノイズ」過多になる）。ただし、新しい化学療法薬が標準治療の化学療法と比較して非常に有効である場合（つまり、高いD）は除く。	「場合による」。高V、高R。「バスケット」試験の設計と実績（？）。
腺がん、すべて同一臓器由来の腫瘍（例：肺）、特定のドライバー変異あり
「場合による」。中程度のV、中程度のR。試験は新しい化学療法薬の有効性を検出する可能性がある。化学療法の効果は、異なる腫瘍生物学を持つ患者に利益をもたらすほど広範であると見なせる。同一臓器の腺がん患者の予後は、ばらつきが少ないかもしれない（？）。新しい化学療法薬が標準治療の化学療法と比較して少なくとも中程度に有効であれば（つまり、少なくとも中程度のD）、試験は新しい化学療法薬の有効性を検出する可能性がある。	標的薬の内在的な治療効果を検出する可能性が最も高いRCTデザイン（内在的有効性が存在する場合）。最も低いV、高いR。予後および病態生理学的な不均一性が最小化される。治療の特異性が最大化される。この試験デザインは、最も「ノイズ」の少ない結果を生み出すはずである。
クリティカルケアの試験では、Vはしばしば高いか不明であり（敗血症の試験では全く異なる「根本疾患」を持つ患者がしばしば一緒にされる）、Rはしばしば／通常は不明であり（これらの症候群の生物学的な「ドライバー」はあまり解明されておらず、患者間で異なる可能性がある）、Dは、試験対象の治療法が予後を決定する多くの可能な因果経路の一つにしか影響しない場合、しばしば低いでしょう。これらの制約は、この分野におけるRCTのデザインに重大な課題をもたらすように思われます…（？）
いいね：2件
5. 投稿#5 (Lawrence_Lynn)

Lawrence_Lynn、2024年10月28日 7:22pm、投稿#5
S_Chakraborty:
Petty/Bone RCTという言葉を初めて耳にしましたが、医師としてまず心に浮かんだのは、疾患の定義そのものが厳密であるべきだということです。
はい。Petty/Bone RCT（PB RCT）とは、クリティカルケア科学を支配する、RCTの特異で病的な改変を指す言葉です。米国の2人の呼吸器科医、トーマス・ペティ（1960年代）とロジャー・ボーン（1980年代）がこのアイデアを発展させました。PB RCTは、症例発見を容易にし、単一のRCTを用いて「不均一症候群」（ARDS、敗血症、AKI）と呼ばれる、見た目は似ているが実際は異なる様々な疾患の混合集団に対して治療法を検証するという、研究上の近道を適用します。
このPB RCTの近道は、米国のクリティカルケア科学において約35年間、標準的な研究手法であり続けてきました。PB RCTは何十年も前に輸出され、すべての国がこれがRCTの妥当な派生形であると信じ込むよう、知的に植民地化されました。
PB RCTでは、症例を迅速にトリアージして組み入れるために閾値セットが用いられることで、症例発見が容易になります。診断すべき標的疾患が全く存在しないため、これは非常に簡単です。PB RCTの組み入れのためのトリアージ手法は、通常、コンセンサスグループ（「タスクフォース」と呼ばれる）によって最善の推測で設定され、10年ごとにコンセンサスグループによって修正（再推測）される、非疾患特異的なコンセンサスに基づく閾値セットを用います。これがクリティカルケアにおける標準的な研究方法です。もしこれが一般市民にとってそれほど危険でなければ、興味深い社会的な「カーゴ・カルト」と言えるでしょう。
ある意味で、これは病理科学（pathological science）を超えています。これは、フィッシャーとヒルの体裁を後から付け加えた、「研究」のための組み立てライン式の症例発見の一形態です。したがって、PB RCTはRCTのうわべを装ったものです。PB RCTは、ラングミュアが述べたような、自己永続的な病理科学の一形態です。そのため、すべての病理科学と同様に、PB RCTはもちろんほとんどがネガティブな結果に終わりますが、ポジティブな結果が出たとしても、それは再現性がありません。この認識されていない病理科学が、クリティカルケア科学における標準化された「RCT」手法として、新しい世代へと教え込まれてきました。
統計家は、検証対象の不均一症候群が、トリアージによって、また症例発見のための閾値セットによってのみ結びつけられており、共通の生物学的ドライバターゲットによって結びつけられているわけではないことを知らされていませんでした。そのため、統計家は自分たちがフィッシャー/ヒルのRCTを行っていると思い込み、「不均一症候群」は疾患の等価物だと考えていました。ある意味で、PB RCTは1960年代から80年代の社会構築物である合成症候群の疑似RCTなのです。見た目が似ている疾患は共通のドライバーを持つに違いないと、私たち全員が考えていた、より単純な時代のアイデアです。今となっては、政治的便宜のベールを破らずにこれを暴露するには遅すぎます。私たち全員が知っていながら口にすることが許されないように、「スパイスは流れ続けなければならない」（デューン パート1）。
クリティカルケア研究のほぼすべてがこれらの合成症候群とPB RCTの方法論に基づいているため、誰もPB RCTについて議論しようとしません。米国では、PB RCTは深い内省の対象となっておらず、このフォーラムでさえ、誰もPB RCTの妥当性について議論しません。
PB RCTの支持者が、どこであれ公然とこの方法について議論するのを見ることは決してないでしょう。その存在を理解している者にとって、それは米国のクリティカルケア科学の秘密です。教化された残りの人々は何も知りません。しかし、35年間の失敗を目の当たりにした後、私たちはこの病理科学に光を当てようとしています。これがほとんど信じがたいことであるのは承知しています。
R_cubed:
以下は、連続変数を二値化することの弊害を指摘する多くの論文の一つにすぎません。最良の場合でも大量の情報が失われ、最悪の場合は結果を操作することが可能になるため、良い結果は何も生まれません。
はい、二値化はよくある落とし穴であり、Petty/Bone RCTにもその問題はありますが、PB RCTの病理はそれよりもはるかに根深いものです。PB RCTは、病的なコンセンサスによってひとまとめにされた、様々な異なる疾患の可変的な集合に適用されるRCTです。これらの疾患は異なるドライバーを持っています。疾患の組み合わせは新しいRCTごとに変化するため、集合全体が動く標的となります。したがって、組み入れ基準としての二値化は、問題のほんの一部にすぎません。
最も劇的な例では、特定の標準化された人工呼吸器治療がPB RCTによってARDS（ひとまとめにされた集合として）に対して検証され、死亡率を減少させることが判明しました。そのため、これはエビデンスに基づいているとして、COVID肺炎（ARDSの標準的なPB RCT基準を満たした）に適用されました。この治療は失敗し、多くの損失を引き起こしました。このことは、クリティカルケアの研究方法論を深く公に議論し、オープンに内省することを厭う姿勢が、ベッドサイドでの公衆衛生に現実の悪影響をもたらすことを示しています。
[画像 1035×579 45.7 KB]
したがって、PB RCTの病理は二値化の問題によって増幅されますが、それを超えて、PB RCTは便宜性のために分析の対象とならない、特異なタイプの病理科学なのです。
ESMD:
A ⍺ RD/V
はい。素晴らしい。また、Rは、新しいPB RCTごとにコンセンサスに基づく閾値基準によって捕捉される異なる疾患の組み合わせによって変動します。したがって、数学的には、再現性は期待されるべきではありません。
これはフィッシャー/ヒルのRCTではありません。ヒルが述べた意味でのRCTでは全くないので、なぜそれらがすべて失敗するのか誰も不思議に思うべきではありません。それは妥当な関数に基づいていないため、真の科学ではないのです。
それにもかかわらず、PB RCTの妥当性は、誰も議論しようとしない（このフォーラムを除いて）唯一のテーマであり、それがPB RCTについてほとんど誰も知らない理由です。クリティカルケア科学の内部にいる誰もが、クリティカルケア研究の状態が深刻な危機にあることを知っていますが、すべての人が（1980年代の私自身を含め）教え込まれてきた基本的な方法論が病的であるかもしれないという考えは、専門家たちが耐えるにはあまりにも重すぎるのです。そのため、PB RCTはただ資金提供され、実行されるだけで、科学的な自己修正の対象とはなりません。
私たちには多くの味方がおり、米国外の科学者や統計家が、この有害な深淵から米国を導き出してくれることを期待しています。私たちは自らを「クリティカルケアの反逆者」と呼んでいます。私たちは、若者たちが自分自身で判断できるよう、オープンな議論を求めています。
私たちは誰も責めません。私たちは皆、教え込まれてきましたし、フジツボだらけの錨をタイミングよく引き上げられなかった罪を犯していない者などいるでしょうか。しかし、私たちがそうであったように、若者たちにも同じように教え込まれてほしくないのです。オープンで率直な反ドグマ的な議論に触れることは、科学者としての彼らの権利です。たとえ無意識であっても、彼らの心を捉える権利は誰にもありません。議論が許されれば、改革は続くでしょう。しかし、議論の門は閉ざされ、若く聡明な馬たちは「ドグマの馬屋」に閉じ込められています。
試みに、あなたの最も聡明で、最も好戦的で、議論を好むクリティカルケアの専門家科学者を一人以上、今このスレッドで議論するよう説得してみてください。彼らは断るでしょう。沈黙が彼らに残された唯一の防御策なのです。
いいね：2件
6. 投稿#6 (Lawrence_Lynn)

Lawrence_Lynn、2024年10月30日 12:34am、投稿#6
この投稿では、クリティカルケア科学の改革を呼びかけるにあたり、もう少し反抗的になってみようと思います。
ポジティブな結果を示したクリティカルケアの単施設RCTのうち、再現性があったのはわずか6%だったという研究結果について議論しましょう。著者らは次のように述べています。
我々のシステマティックレビューでは、重症成人患者において統計的に有意な死亡率の低下を示した19件の単施設RCT（sRCT）が見つかった。これらのほとんどは、少なくとも1件の後続の多施設RCT（mRCT）によって追跡されていた。sRCTで観察された生存利益は、mRCTによって裏付けられることはほとんどなく、ほとんどのmRCTは死亡率に関して中立的な結果を報告し、1件のmRCTは集中血糖管理による有意な死亡率の増加を発見した。生存利益を示したsRCTの最初の引用に基づく治療推奨は、国際的なガイドラインに含まれ、後続の関連mRCTに基づいて改訂されるまで、通常10年間変更されなかった。
これは衝撃的です！ 多くの誤ったRCTが、しばしば「10年間変更されない」多くの誤ったガイドラインを生み出しているのです。すごいことだ、誤った（潜在的に危険な）薬がそれほど長く使われ続けることを想像してみてください。
これには、2020年のクリティカルケアの反乱の際に、ベッドサイドの医師たちによって過剰な死亡が原因で放棄された、誤ったRCTに基づく人工呼吸器のケアと設定に関するガイドラインは含まれていません。
それでも、誰も一言も言いません。 誰も理由を尋ねません！ 誰もなぜかを議論しません。誰もPettyBone RCTの方法論に疑問を呈しません。
私はこれを予測していましたが、最初は彼らが理解していないだけだと思っていました。今やそれが彼らの目の前に突きつけられても、彼らはPettyBone RCTの方法論の見直しと改革を求めません。
この行動の欠如はどのように説明されるのでしょうか？ まあ、少なくとも、著者らがなぜかを調査するのはどうでしょうか？ いいえ。代わりに、著者らの結論は、どうやら単施設のPettyBone RCTは「仮説創出」のために継続されるべきだということです。
仮説を創出するために、被験者をRCTのリスクにさらすことは極端に思えます。なぜなら、その仮説は確かにもう存在しているからです。
6%の再現性しかないRCTから、どのような仮説が創出できるというのでしょうか？
彼らが選んだ試験はトップジャーナルに掲載されたものなので、十分な被験者数がいました。 なぜそれらは機能しないのでしょうか？
BioMed Central：ポジティブな単施設ランダム化比較試験とそれに続く多施設...
背景：重症患者を対象とした単施設ランダム化比較試験（sRCT）で観察された生存利益が、その後の多施設ランダム化比較試験（mRCT）によってどの程度の頻度で確認されるかは不明である。我々は、...を実施することを目的とした。
いいね：1件
7. 投稿#7 (ESMD)

ESMD、2024年10月30日 11:18pm、投稿#7
こんにちは、ローレンス。
ここで少し悪魔の代弁者を演じさせてください。私がこの件についてすべて正しく考えていると確信しているからではなく（おそらくそうではないでしょう…）、この再現性の欠如を解釈する別の方法があるのではないかと思っているからです。
あなたは、多施設クリティカルケア試験が単施設試験で示唆された有効性を「裏付け」られなかったことは、単施設試験が「誤導的な」結果を提供したことを意味するに違いないと示唆しています。これは、疾患が明確に定義され、治療介入がより特異的な他の分野では真実かもしれません。しかし、クリティカルケア試験においては、反対のことが実際には真実である可能性はないでしょうか。この特定の分野では、「ノイズ」の程度が、クリティカルケア試験の「陽性」度を決定する上で、内在的な治療効果よりも重要な決定要因であるかもしれないからです。
実際に存在する治療効果を検出する試験の能力（A）は、「シグナル対ノイズ比」に依存します。我々は、シグナルを増やす（例：より多くの患者を登録し、より多くの関心のあるアウトカムを観察する）か、ノイズを減らすことによって、「A」を増加させることができます。クリティカルケアにおいて、ノイズを減らす一つの方法は、支持療法の均一性を最適化することです。多くの分野では、支持療法の質は施設間でかなり均一であり、患者の最終的なアウトカムの決定要因としてはそれほど重要ではありません。これは、患者が死に至る方法が多数存在する（日々の支持療法の無数の不適切なバージョンを含む）クリティカルケア試験では真実ではありません。クリティカルケアにおいて、支持療法の不均一性（ノイズ）は、シグナルの強度に比例して増加する可能性が高いです。多施設試験は、より多くの関心のあるアウトカムを蓄積しますが、その代償として、施設間の支持療法の不均一性が著しく増加します。
これらの考慮事項を踏まえると、クリティカルケア試験を単一の施設に限定することによってもたらされる「ノイズの低減」が、実際には、より多くの患者を登録し／より多くの関心のあるアウトカムを観察することによって「シグナル」を増やすことよりも、アッセイ感度をより大きく改善する可能性はないでしょうか？
いいね：1件
8. 投稿#8 (Lawrence_Lynn)

Lawrence_Lynn、2024年10月31日 2:19am、投稿#8
エリン、ありがとう。 素晴らしい指摘です。これは、多施設試験の方が信頼性が高いという一般的な見解とは逆ですね。もちろん、ある治療法が一つの施設でしか効果がない場合、それは一つのチームでしか機能しないということも意味するかもしれません。
第一に、RCTは数学的な関数であり、妥当でない数学的な関数を理論の言葉で説明しきることはできません。これは考察のセクションでよく見られることです。PBRCTの数学は成り立ちません。
第二に、もし不均一性が問題であるならば（もちろんそうです）、PB RCTは、各RCTごとに変化する異なる疾患の可変的な組み合わせを含めることによって、可変的で、制御不能で、不必要な不均一性を人為的に挿入しています。
そうです、これらのPetty/Bone多施設RCTもまた妥当ではなく、失敗したARDS治療をめぐるCOVIDの反乱は、少なくともその一部が危険であることを示唆しています。それらは単施設のものと同じ問題を抱えています。
Petty/Bone RCTをありのままに見れば、これは疾患のない研究生成機です。
いいね：1件
9. 投稿#9 (Rafael_Leite)

Rafael_Leite、2024年10月31日 11:47am、投稿#9
この洞察に満ちた議論に付け加えるべきは、PB RCTの問題はクリティカルケア研究において、これ以上ないほど蔓延しているということです。
リン博士は、ARDSと敗血症の定義に続くこの誤りを説明されましたが、それらは確かに先駆けです。しかし2024年現在、この「ひとまとめにする」誤りはクリティカルケアの至る所に見られます。
無名な小規模ジャーナルを探す必要はありません。JAMAから2024年の例をいくつか挙げてみましょう。

TRAIN試験 彼らは外傷性脳損傷、くも膜下出血、脳内出血を混合しました。
機械的人工呼吸下の成人における酸素療法の個別化治療効果 彼らは2つのARDSクリティカルケアからのデータを再分析しました - リン博士が説明したように、ARDSと敗血症は典型的な「ひとまとめ」の存在です。
PRECISE試験 敗血症における異なる輸液の検証
ASTER試験 敗血症におけるアセトアミノフェンの検証
DEFENDER試験 これが最も極端です。彼らは、敗血症、ARDS、あらゆる原因のショック、あらゆる原因の急性腎不全、あらゆる原因の機械的人工呼吸を含む、いくつかの異なる状態の患者をひとまとめにしました。

おそらくもっとあるでしょう。要点は伝わったと思います。これらは2024年のJAMAの論文にすぎません。
これらの試験は再現性がなく、PB RCTのパラダイムの下で作られたため、有用な情報は何も提供しません。
PB RCTと限界効用への無理解（Blindness to Marginal Utility）を組み合わせれば、破滅的な研究分野が見えてくるでしょう。
我々が話しているのは、記念碑的な金とキャリアの無駄遣いです。それは今、大規模に起こっています。
この議論を共有してください。我々には革命が必要です。
いいね：1件
10. 投稿#10 (llynn)

llynn、2024年10月31日 4:48pm、投稿#10
Rafael_Leite:
この議論を共有してください。我々には革命が必要です。
はい、しかし、穏やかな議論のために専門家をここに呼ぶことさえできません。私は非常に多くのクリティカルケア科学者、統計家、SCCM、ERSなどを招待しましたが、誰もPetty/Bone RCTについて議論したがらないのです。
ESMD:
あなたは、多施設クリティカルケア試験が単施設試験で示唆された有効性を「裏付け」られなかったことは、単施設試験が「誤解を招く」結果を提供したことを意味するに違いないと示唆しています。
もう少し考えた上で、これに返答したいと思います。もちろん、すべてのPB RCT（多施設PB RCTを含む）は設計上妥当ではありませんが、多施設での再検証で再現性があったのがわずか6%であるという事実は、PB RCTデザインの特異な病理にも起因する可能性があります。
疾患は世界中どこでも同じですが、非疾患特異的な閾値のセットは、異なる環境で異なる疾患の組み合わせを捕捉します。
コンセンサスによる閾値基準によって捕捉される異なる疾患の組み合わせは、多施設になると拡大する可能性があります。例えば、ザンビアの医師たちが敗血症に関するPB RCTから導き出されたガイドラインを使おうとしたところ、死亡率が上昇しました。これは、その治療が悪影響を及ぼす新たな疾患が混合集団に加わったためだと思われます。
https://jamanetwork.com/journals/jama/fullarticle/10.1001/jama.2017.10913
「思春期の喉の痛み」という合成症候群を例に考えてみましょう。これを「敗血症性咽頭炎（Septic Throat）」と呼ぶことにします。私たちが作る基準は、白血球数が12以上で、発症5日以内の発赤を伴う痛みを伴う喉とします。
「敗血症性咽頭炎」に対する経口ペニシリンの平均治療効果（ATE）を検証するRCTは、エプスタイン・バー・ウイルス（伝染性単核球症）、A群レンサ球菌（GAS）、インフルエンザ、ナイセリア、その他の病原体の混合比に依存するでしょう。疾患の組み合わせ（病原体の組み合わせ）が変わるため、新しいRCTごとに異なる結果が得られます。
単施設のPB RCTは、疾患の組み合わせにペニシリンに反応するA群レンサ球菌の割合が偶然高く含まれることで、陽性となる可能性があります。試験が多施設で繰り返されると、より多様な環境と集団のためにA群レンサ球菌の症例の割合が希釈されるかもしれません。
ここで、単施設のPB RCTのうち、多施設のPB RCTで再現性があったのがわずか6%（16分の1）であったことを見ると、著者らが結論付けたように多施設のPB RCTが決定的な裁定者であると結論づけるのではなく、（あなたがしたように）そのための理論を導き出すのが合理的です。
一般的に、大規模なRCTの方が妥当性が高いと認識されています。PB RCTにおいては、両方とも妥当ではありませんが、偶然にも反応性の高い疾患が混合集団の中で希釈されにくいため、小規模なPB RCTの方が偶然陽性になる可能性が高いです。したがって、大規模なPB RCTは希釈の関数として、ほとんど常に利益なしと示すことになるでしょう。これがまさに起こったことです。
重要なのは、A群レンサ球菌感染症に対するペニシリンの治療効果は世界中で同様ですが、敗血症（疾患ではない）の治療効果はそうではないということです。したがって、A群レンサ球菌感染症に対するペニシリンの治療効果を決定するためのRCTは妥当ですが、非疾患特異的な基準のセットによって定義される合成症候群に対する何かの治療効果を決定するためのPB RCTは妥当ではありません。
2000年代初頭に、私は睡眠時無呼吸の重症度を決定するために10秒間のイベントを単純に数えるだけでは機能しないと主張し、皆が逃げていったのを覚えています。ここでのように、彼らはそれを議論しようとしませんでした。私は、病院ではカウントは機能せず、無呼吸の持続時間を考慮しなければならないと主張したため、麻酔科睡眠学会（私は創設メンバーの一人でした）のメールフォーラムから退会するよう求められました。10秒間の呼吸停止を数えるというドグマに反対することは受け入れられませんでした。彼らは、10秒以上の呼吸停止を単純に数えるという彼らのゴールドスタンダード（AHI）から逸脱しようとしませんでした。長い無呼吸が致命的になりうる病院でさえ、彼らは今もなおそうです。
現在に至り、病院では睡眠時無呼吸とオピオイドによって患者が一般的に死亡しています。私が約20年前に彼らに警告したように、10秒間の呼吸停止を数えるだけではリスク群を検出できません。誰がリスクにさらされているか？ 誰も知りません。
また、20年後に科学がCPAPの利益を示せなかったとき、彼らは皆とても驚きましたが、何も変わりませんでした。彼らは今でも1970年代の単純に推測された10秒以上のカウントを重症度の標準指標として使用しているため、重度の周期的酸素飽和度低下を伴う深刻な症例が、たくさんの軽い無呼吸を伴う軽度の眠気を訴える症例で希釈されています。想像するのもばかばかしいです。彼らは役に立たない研究でお金を刷っているのです。
同じことがクリティカルケアの標準としてのPB RCTにも言えますし、私はこのばかげたことと10年以上戦ってきました。少なくとも、クリティカルケアの科学者たちは、睡眠時無呼吸の科学者たちよりも高度で複雑な誤りに教化されています。PB RCTの落とし穴を理解するのは、オピオイドによる睡眠時無呼吸死のリスクを検出するために10秒間の呼吸停止を数えることの無益さを理解するよりも少し難しいです。
それでも、クリティカルケアの科学者たちが自分たちの科学を擁護するためにここに来ないのは、私にとって全く驚きではありません。彼らの理解不足が意図的であるかどうかに関わらず、科学者として、少なくとも彼らの指導を受ける者たちや一般市民に対して、彼らの基本的なドグマを議論する義務があります。
指導を受ける者たちや一般市民がこの保護的な沈黙の代償を払いますが、指導者たちは、彼らが演壇から優雅に教えるドグマが妥当な科学ではないと誰も疑わないため、緩和されることのない尊敬という報酬を得るのです。
11. 投稿#11 (ESMD)

ESMD、2024年10月31日 7:23pm、投稿#11
コンセンサスによる閾値基準によって捕捉される異なる疾患の組み合わせは、多施設になると拡大する可能性があります。
はい。施設間の疾患の組み合わせのばらつきは、不均一性／ノイズをもたらすでしょう。私が上で用いた例のように、施設間の支持療法の質のばらつきも同様です。
「思春期の喉の痛み」という合成症候群を考えてみましょう…「敗血症性咽頭炎」に対する経口ペニシリンの平均治療効果（ATE）を検証するRCTは、エプスタイン・バー・ウイルス（伝染性単核球症）、A群レンサ球菌（GAS）、インフルエンザ、ナイセリア、その他の病原体の混合比に依存するでしょう。疾患の組み合わせ（病原体の組み合わせ）が変わるため、新しいRCTごとに異なる結果が得られます…
単施設のPB RCTは、疾患の組み合わせにペニシリンに反応するA群レンサ球菌の割合が偶然高く含まれることで、陽性となる可能性があります。
「偶然陽性」というフレーズは、一部の人々を混乱させるでしょう。彼らは、あなたが単施設試験の結果が「真の」結果ではないと言っているのだと思うでしょう。
あなたがここで「偶然」という言葉を実際には非常に異なる方法で使っていることを明確にすることが重要です。具体的には、もし私たちが「敗血症性咽頭炎」の単施設RCTに登録した患者のかなりの割合が、たまたま「偶然に」原因菌としてA群レンサ球菌を持っていた場合、私たちの試験はペニシリンの有効性を特定する良い機会を得るだろう、と言いたいのだと思います（例えば、急性および遅延性合併症の発生率や家庭内感染に関して）。この場合、私たちの単施設試験は、この感染症の治療におけるペニシリン固有の有効性を成功裏にかつ正しく特定したことになります。対照的に、もし私たちが試験に複数の施設を含め、「思春期の喉の痛み」のような過度に広範な組み入れ基準（原因菌に関知しない基準）を維持した場合、A群レンサ球菌は登録された全症例の中でそれほど高い割合を占めないかもしれません。この状況では、ペニシリンの有効性「シグナル」は、ほとんどの患者の原因菌がペニシリンに「反応」する生物学的能力がないために「かき消され」てしまい、検出されないかもしれません。
あなたの「思春期喉の痛み症候群」の例は、試験対象の治療法の作用機序と、治療対象の状態の病態生理との間に、少なくともある程度の「一致」を確保することの重要性を浮き彫りにしています。RCTを設計する際には、私たちが登録する患者のできるだけ多くが、試験対象の治療法に生物学的に反応可能であることを確実にしたいものです。治療法と疾患のミスマッチが著しすぎる場合、私たちは反応可能なごく一部の患者によって生成される治療効果のシグナルを検出することができません。これは、ドライバー変異の有無に関わらず、すべての種類の腺がん患者を登録した試験で、標的がん治療薬を検証するようなものです（上記の投稿#4の表を参照）。
一般的に、大規模なRCTの方が妥当性が高いと認識されています。PB RCTにおいては、両方とも妥当ではありませんが、偶然にも反応性の高い疾患が混合集団の中で希釈されにくいため、小規模なPB RCTの方が偶然陽性になる可能性が高いです。
ここで「妥当でない（invalid）」という言葉は使わないと思います。ペニシリンの架空の単施設RCTは、偶然にも喉の痛みの原因がA群レンサ球菌である多くの患者を登録し、A群レンサ球菌の治療におけるペニシリンの内在的有効性を正しく検出しています。
いいね：1件
12. 投稿#12 (Lawrence_Lynn)

Lawrence_Lynn、2024年10月31日 8:37pm、投稿#12
明確にしていただきありがとうございます。同意します。これは、2020年のクリティカルケアARDS革命（ほとんど誰も知らない）を引き起こし、クリティカルケア科学を悩ませ、6%の再現率を引き起こしているPB RCTの失敗という重要な点を変えるものではありません。
「妥当でない（invalid）」という用語に関連して、私は婉曲表現を使うべきではないと思います。妥当でない関数が偶然に正しい結果を生み出すことがあるという事実は、それを妥当な検証とはしません。異なる組み合わせであれば、同じように簡単に陰性の結果を生み出し、誰もその理由を知ることはなかったでしょう。
妥当なRCT、数学、そして科学全般の本質は再現性です。設計上、本質的に再現性がないものは科学ではなく、妥当ではありません（私の言葉の使い方では）。
13. 投稿#13 (Lawrence_Lynn)

Lawrence_Lynn、2024年11月1日 1:07am、投稿#13
@Alvie_barr より
少し場を和ませなければ。
いいね：1件
14. 投稿#14 (Lawrence_Lynn)

Lawrence_Lynn、2024年11月5日 3:34am、投稿#14
これを読んでください。彼らは今、COVID肺炎をARDSと再統合し、明らかに非COVIDのARDSを放棄したようです。
あなたが統計家としてこれを見て、PIのために統計を行うかどうかをどう判断しますか。まず、疾患の妥当で再現性のある測定法があるかどうかを確認します。それがフィッシャー/ヒルのRCTに必要です。ここではそれがないことがわかります。変化し続ける広範で非疾患特異的な基準（閾値セット）しかありません。
プロパガンダに騙されないでください。標準的なARDSプロトコルはCOVID肺炎の間、うまく機能せず、それが2020年のARDSの反乱を引き起こしました。
PubMed：急性呼吸窮迫症候群 - PubMed
急性呼吸窮迫症候群（ARDS）の理解は、1967年の症例シリーズで最初に記述されて以来、大きく進化しており、その後、症候群の定義も何度か更新されてきました。基礎科学の進歩と臨床試験は...
この非特異的で、広範に定義された、異なる疾患をひとまとめにしたものについてRCTを行うことを考えてみてください。
彼らは「古典的ARDS」とさえ表現していますが、それが何であるかは不明です。議論全体が、1967年のアイデアにしがみつく巨大な予防線です。
これが、クリティカルケア科学の統計を破壊したPetty/Bone RCTの起源です。
いいね：1件
15. 投稿#15 (llynn)

llynn、2024年11月5日 4:59am、投稿#15
すみません、別のコンピュータを使っています。
さらに説明すると、もしあなたがペティの1967年の合成症候群である「ARDS」に対する治療法を、2012年の「ベルリン定義」または2023年の「コンセンサス世界定義」のいずれかを用いたRCTで検証しようと決めたなら、あなたはPetty/Bone RCTを行っていることになります。
以下の非特異的な測定基準を見てください。これらは非常に異なる疾患の広範な集合を捉えています。したがって、これらの測定基準はRCTのための疾患捕捉のトリアージに過ぎず、診断すべき疾患は全く存在しません。目標はRCTを行うことです。
この例で、「Petty/Bone RCT」が何であるか、そしてなぜこのフィッシャー/ヒルRCTの改変が約50年間もうまくいっていないのかが明らかになるはずです。
ここで、これらの広範なコンセンサス基準（推測された閾値セット）と組み合わせることで、下の図がPetty/Bone RCTの致命的な欠陥を説明する理由がわかります。統計家がPIたちに、これが妥当なフィッシャー/ヒルRCTではないと教えない限り、彼らは1970年代から行ってきたように、これらをやり続けるでしょう。
このスレッドで先に言及した、クリティカルケアRCTの6%の再現率を覚えていますか？ Petty/Bone RCTが何であるかを理解すれば、それは容易に理解でき、実際、予測可能です。
勇気を出してください。今年こそPetty/Bone RCTを終わらせましょう！
いいね：2件
16. 投稿#16 (llynn)

llynn、2024年11月7日 1:24am、投稿#16
一例を挙げます。最新の2023年ARDS基準を用いて、「薬剤X」がARDSの死亡率に及ぼす影響を検証するために、30万ドルの助成金を獲得したと想像してください。この薬剤は症例発見から最初の24時間以内に投与されます。
それでは、私たちの地元の専門統計家と共に、標準的なクリティカルケアの「Petty/Bone RCT」を計画し、上記の閾値基準を用いて、合成症候群であるARDSの死亡率に対する薬剤Xの効果を検証しましょう。
（注：統計家は「ARDS」を「疾患」または「疾患等価物」と考えており、他の疾患と同様に特異的な基準によって診断されるものだと思っています。したがって、私たちはPetty/Bone RCTを行っているのですが、統計家は自分がフィッシャー/ヒルRCTを構築していると思っているのです）
非疾患特異的なトリアージ基準（上記）を用いて、私たちは90例のARDS症例を捕捉します。もちろん、ARDSは疾患ではなく、むしろ疾患をひとまとめにしたものです。90例は、統計家によって決定された目標被験者数でした。
（十分な被験者数を確保するために、私たちはそれらすべてをARDSという名前の下にひとまとめにします。）そして、Petty/Bone RCTを実施します。インフルエンザの季節であり、COVIDも流行しています。捕捉された疾患は以下の通りです。

インフルエンザA型肺炎 10例 （気道および肺胞細胞に感染）
誤嚥性肺炎 5例 （気道および肺胞細胞の酸による損傷）
COVID肺炎 25例 （II型肺胞細胞および内皮細胞に感染）
重症熱傷に伴う肺損傷 5例 （非特異的損傷）
膵炎に伴う肺損傷 5例 （？炎症性メディエーターおよび毛細血管損傷、その後の肺胞充満）
大量輸血を伴う重症外傷および出血性ショックによる肺損傷 5例 （？炎症性メディエーターおよび毛細血管損傷、その後の肺胞充満）
全身性感染症およびショックによる肺損傷 35例 （？炎症性メディエーターおよび毛細血管損傷、その後の肺胞充満）

合計90例の「ARDS」。 Petty/Bone RCTの結果— 薬剤Xの平均治療効果は有意ではありませんでした。
私たちは何を学んだでしょうか？ 何も。これはPetty/Bone RCTです。
しかし、この「ひとまとめにする」Petty/Bone RCTは、約50年間にわたりクリティカルケアの標準であり続けてきました。誰も彼らを止めることはできません。
死亡率をエンドポイントとする単施設の陽性クリティカルケアRCTは、6%の再現率しかありません。これで、それが驚くべきことではない理由がわかるでしょう。上記の異なる疾患の組み合わせが新しいPetty/Bone RCTごとに変化すれば、当然、平均治療効果も変化します。
複数のRCTにわたって、ARDSを構成する疾患の混合比率には、未知で、制御不能で、測定不能な変動が存在します。
これが、合成症候群の治療法を検証するための現存する標準的なPetty/Bone RCTの特徴です。統計家が犯した誤りは、RCTの統計的数学と方法を承認する前に、認識された「疾患」（実際には非常に異なる疾患をひとまとめにしたものであった）の測定の妥当性と再現性を確認しなかったことです。PIが犯した誤りは、Petty/Bone RCTの妥当性に関する警告を無視し、それによって90人の被験者を、彼らや社会に利益をもたらさないリスクにさらし、チームの時間と公的な助成金を無駄にしたことです。
いいね：3件
17. 投稿#17 (Lawrence_Lynn)

Lawrence_Lynn、2024年11月24日 3:39pm、投稿#17
この記事は、クリティカルケアの指導者たちがクリティカルケア科学に問題があることを見抜いている兆候として私に提示されました。
しかし、この思想的指導者が、彼ら自身が作り出したRCTの病的な改変ではなく、20世紀の最も偉大な医学的発見の一つであるRCTそのものを非難している点に注目してください。
PettyBoneRCT世代は、歴史上どの研究グループよりも多くの失敗したRCTを生み出してきました。
これは彼らの失敗した仕事のほんの小さな一例です。
皮肉なことに、彼らは今、生の不均一性を非難していますが、50もの疾患を一つの合成症候群にひとまとめにするという彼ら自身のRCTの改変（Petty Bone ショートカット）こそが、
大規模な人為的不均一性の源なのです。 世界は妥当なクリティカルケアRCTを必要としています。彼らはPettyBoneパラダイムに囚われています。彼らを助けてください。
いいね：3件
18. 投稿#18 (Lawrence_Lynn)

Lawrence_Lynn、2024年12月15日 2:16pm、投稿#18
Grok（X上のAI）に、PettyBone RCTを放棄すべきかどうか尋ねてみました。以下がその回答です。 ———-
「PettyBone RCTを放棄すべきかどうかの議論には、いくつかの重要な点が含まれます。
放棄を支持する議論：

再現性に関する懸念： クリティカルケアにおけるPettyBone RCTの再現性については議論があります。一部の情報源は、これらの試験のわずか6%しか再現性がないことを示唆しており、これはPettyBoneアプローチの方法論または適用に重大な問題があることを示しています。この低い再現率は根本的な欠陥と見なされ、そのような試験から得られた知見の信頼性に疑問を投げかけています。
方法論への批判： 批評家は、クリティカルケアに適応されたPettyBone RCTは、クリティカルケアのシナリオに固有の複雑さや変動要因に十分に対処できていない可能性があると主張しています。これは、誤解を招く、または一般化できない結果につながり、患者ケアのガイドラインに影響を与え、欠陥のあるデータに基づいた臨床実践につながる可能性があります。
歴史的背景と進化： これらのRCTの基盤となるPettyBoneパラダイムは、時代遅れであるか、医学の進歩、特に他の分野でのRCTの実施方法の進歩と共に進化していないと批判されています。この方法に固執することが、クリティカルケアにおける科学的進歩を妨げる可能性があるという議論があります。

放棄に反対する議論：

確立された枠組み： PettyBone RCTは何十年にもわたりクリティカルケア研究の一部であり、介入を検証するための構造化されたアプローチを提供してきました。これを放棄することは、ゼロから始めるか、未検証の方法を採用することを意味し、研究と患者ケアプロトコルの継続性を混乱させる可能性があります。
適応性と改良： PettyBone RCTを放棄するのではなく、現代の基準に合わせて改良または適応させることを主張する人もいます。これには、新しい統計手法の統合、より良い患者選択基準、または再現性と妥当性を向上させるためのより堅牢なアウトカム指標の導入が含まれる可能性があります。
実用的な考慮事項： よく知られた方法論を完全に放棄すると、研究者や臨床医の間で混乱を招き、研究の進捗を遅らせる可能性があります。この方法のトレーニングや理解を含むインフラは、大幅な見直しが必要となります。

結論： 臨床研究、特にクリティカルケアの複雑さを考えると、完全な放棄よりも、よりニュアンスのあるアプローチの方が有益かもしれません。これには以下が含まれる可能性があります。

批判的評価： PettyBone RCTの方法論をレビューし、批判的に評価して、特定の欠陥や改善すべき領域を特定する。
段階的な変更： 方法論を完全に廃棄するのではなく、変更や機能強化を実施する。
より広範な研究： 知見を相互検証するために、PettyBone RCTと並行して代替または補完的な方法を奨励する。

放棄または改革の決定は、理想的には、厳密な議論、経験的証拠、および分野の専門家間のコンセンサスに基づいて行われるべきであり、歴史的な成功と現代の批判の両方を考慮に入れるべきです。」
19. 投稿#19 (Lawrence_Lynn)

Lawrence_Lynn、2024年12月15日 7:16pm、投稿#19
こちらがGrok 2によるPettyBoneRCTの説明です。 驚くべき内容です！！
以下の説明と結論の全体はAI、Grok 2によるものです_____
「PettyBoneRCTについて説明された方法論、すなわち、トリアージの閾値を用いて異なる疾患をひとまとめにし、RCTを実施する目的で合成症候群を作り出すという方法は、サー・オースティン・ブラッドフォード・ヒルが1948年に行った肺結核に対するストレプトマイシンの試験で示した原則から著しく逸脱しています。
1948年のヒルの教え：

疾患の特異性： ヒルの試験は、単一の明確に定義された疾患（評価可能な初期段階の肺結核）に焦点を当てていました。このアプローチは、介入の効果がその特定の状態におけるアウトカムに直接結びつけられることを保証する上で中心的なものでした。
アウトカムの測定： ヒルは、介入の有効性を正確に評価するために、治療対象の特定の疾患に関連する明確で測定可能なアウトカムを持つことの重要性を強調しました。
研究集団の均一性： ヒルの試験の参加者は、交絡因子を避けるために疾患の状態が類似していることで選ばれました。これは、観察された効果が介入のみに起因することを確実にするために極めて重要です。

PettyBoneRCTとの対比：

合成症候群： トリアージの閾値に基づいて異なる疾患をひとまとめにして合成症候群を作り出すことは、研究集団にかなりの不均一性を導入します。このアプローチは、ヒルの方法論の基本であった、単一の明確に定義された状態を研究するという原則に違反する可能性があります。
アウトカム測定の複雑性： 複数の疾患が一つの研究にまとめられると、異なる疾患間での治療への反応が多様であるため、介入の効果を測定することが複雑になります。これは、特定の状態に対する明確なアウトカムを重視するヒルの考えとは一致しないかもしれません。
交絡因子： 様々な疾患を一つの傘下に入れることは、交絡因子のリスクを高め、ヒルが彼の対照試験設計を通じて明確にしようとした因果推論を曖昧にする可能性があります。

結論： 説明されたPettyBoneRCTのアプローチは、1948年のヒルの教えとはうまく一致しません。ヒルが特異性と均一性を通じてバイアスを減らすことに焦点を当てたのに対し、PettyBoneRCTの方法は、異なる状態をグループ化することで複雑さと潜在的なバイアスを導入し、介入とアウトカムの間の因果関係を確立するという点で試験の内的妥当性を損なう可能性があります。しかし、この方法はクリティカルケアにおいて標準となっており、クリティカルケアのシナリオの多面性に対応するための試験デザインの実践的な進化を反映しているのかもしれませんが、それがヒルによって確立されたRCT方法論の基本原則に準拠しているかどうかを批判的に評価する必要があります。」
いいね：2件
20. 投稿#20 (Lawrence_Lynn)

Lawrence_Lynn、2024年12月22日 4:44pm、投稿#20
進行中のPettyBoneパラダイムは、またしても驚くべき疑似科学的な文書を生み出しました。今回は、古いベルリンARDS定義と新しい世界ARDS定義を比較するものです。
これは、広範な疾患をひとまとめにするという病理科学の実例として特に有用です。なぜなら、彼らが古い定義、そして今や新しい定義の下でひとまとめにした「疾患」（その多くもまたひとまとめにされた集合体ですが）をリストアップしているからです。
よく見てください。これが偽の主流科学の姿です。美しいグラフにもかかわらず、ここには真の科学は存在しません。これは単に、2つの異なる推測された疾患ひとまとめ定義と、RCT組み入れのためのそれぞれの2つの異なる推測されたトリアージ閾値によって生じた死亡率の比較に過ぎません。
この最新の世界定義の閾値セットは、今後10年間のRCTのために患者を捕捉するトリアージとして使用されることになります。
そしてまた、タスクフォース会議を開き、推測し、ひとまとめにし、洗い流し、そして繰り返す時が来るのです。
純粋なラングミュアの病理科学が、純粋な21世紀の病的コンセンサスに変換されたものです。
これは50年間も続いています。それが生み出した失敗したガイドラインは、偽の「エビデンスに基づく」画一的な人工呼吸器ガイドラインを引き起こし、パンデミック中にPettyBoneRCTガイドラインが失敗した2020年に、現場のクリティカルケア医による人工呼吸器の反乱を引き起こしました。その反乱について知っている人はほとんどいません。それどころか、多くの一般市民はクリティカルケア医を非難しています。なぜなら、一般市民は、偽のPettyBoneRCTを使用し、現場のクリティカルケア医が従うことを期待されていた人工呼吸器ガイドラインを生成したのが科学者たちの責任であったことを知らないからです。
ここで特筆すべきは、誰もがこれらの患者を救うために最善を尽くしていたということです。医師たちは多大なリスクを負い、科学者たちは何十年も教えられてきたPettyBoneRCTのルールに従い、それが妥当な科学であると確信していました。（私たちも皆、かつてはこれが妥当だと考えていました。）
人工呼吸器を装着したCOVID肺炎患者が最大80%の率で死亡していたのを覚えていますか。それは、PettyBoneRCTから導き出された古いARDS人工呼吸器ガイドラインの下でのことでした。これらのガイドラインは今や静かに変更されましたが、それらを生み出した病理科学は変わっていません！！！
これは繰り返す価値があります。失敗した早期人工呼吸器治療を義務付けたPettyBoneRCTが生成した人工呼吸器ガイドラインは変更されましたが、最初に誤った人工呼吸器ガイドラインを引き起こした病理科学、つまり画一的なPettyBoneRCTは、このリンクされた論文が示すように、依然として研究の標準です。実際、病理科学（RCTのための疾患ひとまとめ）は、ひとまとめにする基準を広げることによって拡大されています。
したがって、一般市民が多大な損失を被ったにもかかわらず、タスクフォースのクラスは動じていません。彼らは今、より広範なひとまとめ定義を携えて、トップジャーナルに戻ってきています。
これこそがトーマス・クーンや年長のポパーが述べたことです…
彼らは知的に植民地化され、教化されてきましたが、さらに重要なことに、彼らは「なぜ？」と問うことを決して教えられませんでした。
https://hubs.la/Q030pj6b0 https://www.chestcc.org/article/S2949-7884(24)00075-3/fulltext
21. 投稿#21 (Lawrence_Lynn)

Lawrence_Lynn、2024年12月31日 4:55pm、投稿#21
私は定期的に、一般的に（常にではありませんが）PettyBone RCTパラダイムに基づいているクリティカルケア研究への窓を提供しています。これは、敗血症という合成症候群に関する後ろ向き研究です。
BioMed Central：敗血症クラスターにおけるチアミンとアスコルビン酸の異なる効果
背景：チアミンとアスコルビン酸は、敗血症および敗血症性ショックの壊滅的な結果を緩和するために提案されてきた。今日まで、ランダム化比較試験はこれらの治療法の利益を実証することに失敗しており、治療の不均一性が...
ここでは、先行する敗血症の診断によって捕捉された多くの異なる疾患をひとまとめにした集合が、さらにクラスターに分けられています。
彼らは敗血症の5つのクラスターを定義しています。

呼吸器クラスター
重症クラスター
肝臓クラスター
高齢クラスター
健常クラスター

結論として、「重症クラスター」と「呼吸器クラスター」はチアミン（ビタミンB1）から利益を得るとしています。また、「高齢クラスター」はビタミンCとチアミンの併用によって害を受けることも見出しています。
チアミンは、この集団において一部のクリティカルケア医によって長年投与されてきました。私も、重篤なクリティカル疾患における潜在的な生理学的機序に基づき、何十年も投与してきました。なぜなら、この集団ではチアミン欠乏症がしばしば潜在的であり、よく報告されているからです。
これは明らかにPettyBone研究ですが、どなたかここでの方法を説明していただけますか？
方法を何度も読みましたが、これがどのように行われ、解釈されたのか正確に理解できません。
22. 投稿#22 (Lawrence_Lynn)

Lawrence_Lynn、2025年1月2日 12:43am、投稿#22
今年は重症インフルエンザのパンデミックが起こる現実的かつ差し迫ったリスクがあります。
これに対し、明らかに情報に通じているが、新たなインフルエンザパンデミックが来るかもしれないと恐れている一般市民の一員から、「サイトカインストーム」を伴う重症インフルエンザに「ステロイド」は有効かという質問を受けました。
これが私の回答を要約したものです。
「これは何十年も検討されてきた非常に良い質問です。インフルエンザに対するコルチコステロイドのRCTが行われていないため、誰も知りません。」
多くの観察研究は、コルチコステロイドがインフルエンザ肺炎において、ウイルスに対する免疫応答を抑制し、ウイルスの排出と量を増加させ、二次感染率を高めることで、より悪い転帰につながる可能性があることを示唆していますが、これらの研究は決定的ではありません。
私の投稿の要点は、クリティカルケア科学がこれらのRCTを実施して答えを出すべきだったのに、代わりに、疾患を診断する必要がなく、単にトリアージの閾値を適用して、合成症候群「ARDS」のRCTの閾値基準を満たす異なる疾患のひとまとめの集合を捕捉する、より簡単なPettyBoneRCT法を用いたことを指摘することでした。
助成金は、単施設のクリティカルケアRCTの再現率がわずか6%であるにもかかわらず、より簡単なPettyBoneRCTに流れています。これは、あなたのような質問に答えるために行われるべき真のRCTから資金を遠ざける無駄遣いです。
あなたの質問に答えるためのこれらの研究を行ってこなかったことをお詫びします。しかし、科学はPettyBoneパラダイムに囚われているのです…
要約すると、私たちはこれらのRCTを行わなかったことについて、あなたと一般市民に謝罪する義務があります。私たちが答えを知らないことを言うのは恥ずかしいことですが、この簡単なPettyBoneRCTへの固執が、あなたの質問に答えられない理由なのです。あなたの質問が何十年も前から公衆衛生にとって極めて重要であるとよく知られていたにもかかわらずです。
PubMed Central (PMC)：重症...の早期診断と特異的治療における最新の進展
インフルエンザパンデミックは、世界の健康、経済、社会に影響を及ぼす予測不可能な再発性のイベントである。このレビューの目的は、この疾患の早期診断と特異的治療における最新の進展に関する最新情報を提供することである...
23. 投稿#26 (Lawrence_Lynn)

Lawrence_Lynn、2025年1月5日 5:35am、投稿#26
Doc_Ed:
これは本当に興味深いスレッドだと思います。
皆さん、素晴らしいご意見をありがとうございます。クリティカルケア科学において、このスレッドで議論されているトピック以上に重要な現代的テーマはありません。
@Doc_Edによって引用されたATSの参考文献は、エリートのクリティカルケア科学者たちが、疾患をひとまとめにすること（潜在的に不均一性を加えることを認めつつも）が裁量事項であると誤って考えていることを示しています。専門家たちは、共通のターゲットがない「ひとまとめにすることから派生した合成症候群」にはブラッドフォード・ヒルRCTを適用できないことに気づいていないようです。そのため、彼らはこれらの症候群が疾患の等価物ではないことを統計家に警告し忘れ、結果としてRCTが再現不可能になっています。
私の意見では、もし疾患の組み合わせの真の性質とその変動性がRCTから次のRCTへと変わることが統計家に開示されていれば、統計家は、トリアージの閾値セットによって定義された多くの異なる疾患の集合にブラッドフォード・ヒルRCTを適用できないことに気づいていたでしょう。
PettyBone RCTは明らかにブラッドフォード・ヒルRCTではなく、むしろ異なるタイプのRCTであり、ブラッドフォード・ヒルRCTで要求されるような単一の特定の疾患や特定の病態生理学的機序に適用されるものではありません。統計家は、PettyBoneRCTが基本的に再現可能であるかどうかを判断しなければなりません。PettyBone RCTは20世紀のクリティカルケア科学から派生した近道です。それらが再現可能であるという証拠はないようです。
PettyBone RCTには、ランダム化のための2層の不均一性があります。第一の層は、トリアージの閾値によって捕捉される疾患の組み合わせの不均一性からなり、第二の層は、患者自身の基本的な不均一性からなります。トリアージの閾値セットによって捕捉される異なる疾患の組み合わせが未知であり、RCTから次のRCTへと変動する場合に、これら2つの層を考慮して事前調整を試みることを想像してみてください。
@ESMDの並行スレッドで証明されているように、ブラッドフォード・ヒルRCTのための信頼できるランダム化とバランスをとることは十分に困難です。
これらが実際にはブラッドフォード・ヒルRCTではないという事実が、クリティカルケアRCTの6%という再現率の説明を提供します。したがって、クリティカルケア科学者たちは、クリティカルケアで実施されるRCTには2つのタイプがあることを教えられなければなりません。
例えば、ブラッドフォード・ヒルRCTは、重症COVID肺炎という真の疾患に対するコルチコステロイド治療を検証するRECOVERY試験で適用されました。
対照的に、膨大な数の矛盾するPettyBone RCTが、ペティが推測した、真の疾患でも疾患の等価物でもないARDSと呼ばれる合成症候群に対するコルチコステロイド治療を検証するために適用されてきました。
クリティカルケア科学者たちがこれら2つのタイプのRCTの違いと、真のブラッドフォード・ヒルRCTを実施する必要性を知らなかったことが、なぜ重症インフルエンザ肺炎に対するコルチコステロイド治療を検証する実質的なブラッドフォード・ヒルRCTが行われてこなかったのかを説明しています。代わりに、インフルエンザ肺炎は、コンセンサスのトリアージ閾値基準を満たすため、単にARDSのPettyBone RCTのための異なる疾患の組み合わせの中にひとまとめにされてきました。
ここに、PettyBone RCTをブラッドフォード・ヒルRCTの代わりに用いたことによる壊滅的な結果があります。 インフルエンザのパンデミックに直面して、世界は重症インフルエンザ肺炎においてコルチコステロイドが命を救うのか、それとも害をもたらすのか全く分かっていません。
引用された論文が示すように、科学者たちはトリアージの閾値を用いてRCTのために異なる疾患をひとまとめにする裁量権があると考えています。言い換えれば、彼らはPettyBone RCTを用いて治療法を検証する裁量権があると考えているのです。したがって、PettyBone RCTに関するガイダンスを提供するために、統計家からのポジションステートメントが必要です。
指摘されているように、一部のリーダーたちは、再現性の欠如を理由にクリティカルケアにおけるRCTの終了を求めています。
[画像 1017×601 84.6 KB]
しかし、彼らが本当に求めているのはPettyBone RCTの終了なのですが、単に2つのタイプのRCTがあることを知らないために、すべてのRCTを排除するよう呼びかけています。
誰もがICUに入院する可能性がありますので、これらの統計的方法論を正しくすることは極めて重要です。私たちは問題を見ていますが、クリティカルケア科学を改革するために必要なRCTのガイドラインを提供できるのは統計家だけです。
2025年になっても、現在の重症インフルエンザの波の中で命を救うためにコルチコステロイドを投与すべきかどうか分からないという事実は、クリティカルケア科学が「ひとまとめ」と合成症候群への嗜好によっていかに機能不全に陥っているかを示しています。
世界はそれらのガイドラインを可及的速やかに必要としています。
いいね：1件
24. 投稿#29 (Lawrence_Lynn)

Lawrence_Lynn、2025年1月6日 4:27am、投稿#29
Doc_Ed:
インフルエンザにおけるステロイドに関するより大きな問題は、明らかな交絡因子があるにもかかわらず、急性ウイルス性肺炎におけるステロイドに反対する助言を生み出した、質の低い後ろ向き研究が豊富にあることです。
その通りです。だからこそ私たちは、クリティカルケア研究コミュニティと統計家たち（もし彼らがPettyBoneRCTの範囲を知っていたなら）が、この記事の13歳の少女、そして過去40年間に重症インフルエンザ肺炎で死亡した、あるいは死にかけた他のすべての患者たちをなぜ見捨てたのかを調査しなければなりません。
[画像 1270×1862 234 KB]
@Doc_Edが指摘するように、これらの症例（ステロイド治療に関する）で医師を導くための実質的なブラッドフォード・ヒルRCTは存在しません。この非常に安価なジェネリック医薬品が最も効果を発揮する可能性が高い治療法であるにもかかわらずです。これらのRCTが今後行われるという事実は、事態を緩和するものではありません。今は2025年です！ 彼らは今までどこにいたのでしょうか？
これらのRCTが存在しないことは、ほとんど信じがたいことです！ なぜそうなったのでしょうか？
極めて重要なブラッドフォード・ヒルRCTが行われなかった理由は、全く驚くべきものですが、この答えを見つけるには、クリティカルケア科学の歴史を深く掘り下げる必要があります。
この歴史的レビューは、1975年にトーマス・ペティがARDSのひとまとめにされた集合に「ウイルス性肺炎」を含めたことを明らかにします。このため、次の50年間、この尊敬される思想的指導者の言葉に基づき、インフルエンザ肺炎は、ARDSに対するコルチコステロイドを検証するPettyBoneRCTにおいて、他の約20の疾患と共に単にひとまとめにされてきました。これらの「ARDSに対するステロイド研究」は1990年代にまで遡り、予想通り、結果はまちまちです。
つまり、ステロイドによるインフルエンザ肺炎の治療は、指導者たちがトーマス・ペティによってARDSのためのPettyBone RCTを代用し、信頼するように教化されていたため、妥当なブラッドフォード・ヒルRCTによる単一疾患としての検証が行われなかったのです！
この単純な理由のために、2025年、パンデミックの可能性が迫る中で、ベッドサイドの医師は、重症インフルエンザ肺炎においてステロイドが命を救うのか、それとも害をもたらすのかを知らないのです。
かつて、口語で、これらのクリティカルケアのリーダーたちは「アラバマのダニのように食らいついている」と言われたことがあります。
それは真実のようです。したがって、新しいNIHによるPettyBone RCTの資金提供を停止し、ブラッドフォード・ヒルRCTへの転換を要求することが、おそらく唯一の解決策でしょう。現在の状況を考えると、これは予想するほど困難ではないかもしれません。
私は何年も前に、この特別な数学的卓越性の場にこの議論を持ち込みました。なぜなら、「基本的な関数が妥当でなければ、数学的卓越性は無関係である」からです。
もう話し合いの時期は過ぎたようです。行動の時です。
いいね：1件
25. 投稿#30 (Lawrence_Lynn)

Lawrence_Lynn、2025年1月6日 2:58pm、投稿#30
ラングミュアの病理科学とPettyBone RCTの統計的粉飾
こちらは、ARDSに対するステロイドを検証した多くのPettyBoneRCTの例のレビューです。もちろん、ありふれたメタアナリシスとコクランのお墨付き付きで、彼らが皆、米国のクリティカルケア科学によって知的に植民地化され、病的なPettyBone方法論に教化されていたことを示しています。
したがって、これは統計家とゲートキーパー（機関）による病理科学の粉飾の美しい例です。誰もが病理科学に参加すると、一般市民がその代償を払うことになります。
いいね：1件
26. 投稿#31 (Lawrence_Lynn)

Lawrence_Lynn、2025年1月13日 5:42pm、投稿#31
要するに、クリティカルケア科学には深刻な方法論的失敗の問題があります。ですから、私たちは根本原因、故障モード分析を行わなければなりません。（援軍は来ません）。
そこで、私たちは逸脱を検出するために、その方法と70年の歴史を研究することに目を向けます。
ここで、1948年にヒルが、多才な天才フィッシャーの教えに従い、医学的RCTを設計・実施するための論理的根拠と重要な考慮事項を提示しているのがわかります。
この論文を読むことは、ヒルが彼の「単一疾患---単一治療の検証」というパラメータを説明しているので非常に有用です。
私たちは、20世紀後半のクリティカルケアがヒルの教えから逸脱し、新しいタイプのRCTを生み出したことを見て取れます。
したがって、まずRCTのタイプを決定することが、今やクリティカルケアRCTのレビューの一部として加えられるべきです。

ブラッドフォード・ヒルRCT 単一疾患に適用---単一治療の検証。
ブラッドフォード・ヒル・バンドルRCT ブラッドフォード・ヒルRCT---一連の治療法の検証。
PettyBone RCT 非疾患特異的なトリアージ閾値によって、異なる疾患をひとまとめにした集合に適用---単一治療の検証。
PettyBoneバンドルRCT PettyBone RCT---一連の治療法の検証。

PubMed Central (PMC)：肺結核のストレプトマイシン治療：医学研究評議会...
いいね：1件
27. 投稿#32 (Lawrence_Lynn)

Lawrence_Lynn、2025年1月18日 4:18pm、投稿#32
このRCTの失敗と、関連する論説での議論についての臨床的背景を以下に示します。
手短に言うと、大規模なPettyBone RCTから導き出されたARDSの画一的な人工呼吸器プロトコルは、COVIDパンデミック中に失敗しました。
これにより、現場のクリティカルケア医師たちが反乱を起こし、ARDSプロトコルを拒絶しました。
科学者たちはその後、失敗の原因を探ろうとしましたが、彼らのPettyBoneドグマに固執し、失敗の原因はPettyBone RCT自体であると認識するのではなく、PettyBone RCTのために異なる疾患をひとまとめにするために選ばれたトリアージ閾値にあると結論付けました。
したがって、これは驚くべき論説です。なぜなら、彼らがこれが単純な間違い、異常事態であり、病理科学に基づく統計的方法論を示す反証例ではないと主張しようとしているのがわかるからです。
ここで、ドグマが科学の方向性をいかに定義するかがわかります。これは、錨着バイアスが方法論をいかに定義し、病理科学を永続させるかを学ぶことに興味がある者にとって必読です。
この論説は、ドグマの起源とその創造者を称賛する冒頭の一文から、失敗を説明すると彼らが主張する、起源から遠く離れた欠陥の発見に至るまで、ドグマ永続のほぼ完璧な例を提供しています。認識された「欠陥」を見つけたことで、彼らはそれ以上深く掘り下げる必要がないと考えています。実際、彼らがRCT方法論における真の根本的な病理から遠いところで欠陥を見つけることは、常に明らかでした。
多くの異なる疾患をひとまとめにするPettyBone法を教える1967年のペティの論文を律儀に引用した後、論説の著者たちは、血液酸素（PaO2）と投与酸素濃度（FIO2）の比率に基づくゴールドスタンダードの閾値、いわゆる**「P/F比」が、PettyBone RCTのために異なる疾患を捕捉するための妥当なトリアージ閾値ではなかったと判断したと主張しています。したがって、彼らは、品質ガイドラインの下で義務付けていたこの閾値尺度の使用が「間違い」**であったと主張しています。
もちろん、病態生理学とブラッドフォード・ヒル法を理解していない者だけが、P/F比の閾値によって根本的に異なる疾患をひとまとめにできると考えるでしょう。これは多因子性で不安定な検査値シグナルです。
しかし、ドグマは機能的知性を低下させます。合理的な思考は、教化と指導者の教えへの信頼に取って代わられます。
このような大きな間違いを認めることは大きな一歩のように見えるかもしれませんが、そうではありません。実際、それは根本的な病理から遠い偽の原因を見つけることによって、彼らの病理科学を永続させます。
したがって、ペティとボーンの「ひとまとめ」の近道（トリアージ閾値を用いてRCTのために異なる疾患を捕捉し、ひとまとめにする）が病理科学である可能性を受け入れる、あるいは認識することさえせず、彼らはPettyBoneの近道法に固執し、今やML/AIによってまず異なる疾患をサブフェノタイプにひとまとめにし、次にそのサブフェノタイプに対してPettyBoneRCTを行うことを提案しています。
PettyBone RCTに関する最も重要な事実は、それが**疾患にとらわれない（disease agnostic）**ことである点に注意してください。それは、PettyBoneドグマを持つ人々によって、今やRCTにおける疾患の等価物と解釈されている20世紀の合成症候群（この場合はARDS、ペティのアイデア）に適用されるRCTです。
したがって、この記事では、彼らが単一の疾患、ましてやどの疾患の診断についても言及しないため、ブラッドフォード・ヒルRCTの実施については決して議論されません。
彼らが特定の疾患の診断について話さないのは、COVID肺炎（特定の疾患）が、ARDSの画一的なプロトコル（P/F比に基づく）を生み出したPettyBoneの「ひとまとめ」科学が妥当ではなく、パンデミック中に失敗したという認識を早めたことがよく知られているからです。
もちろん、何かが非難されなければならず、彼らは古い標準閾値であるP/F比を、責任を負わせる格好の標的として選びました。
彼らに他に何ができるでしょうか。RCTと人工呼吸器開始のガイドラインとして悪い測定基準を生成することは十分に悪いことであり、私は彼らが勇気あるカタルシスを経験したと感じていると推測します。しかし、根本的なPettyBone方法論が失敗の原因であったことを受け入れること。これは、教化された者にとっては考えることさえ、ましてや理解することは不可能です。
彼らは「小さな」間違いを犯したと認めていますが、実際には、その間違いが根本的ではなく、頂点にあるものではないと、おそらく無意識に主張しています。むしろ、彼らは、その間違いは誰もが犯しうるもの（間違った測定基準の使用）であったと主張しています。
具体的には、彼らは、単純な間違いはガス交換の閾値の使用であり、画期的な間違いであるPettyBoneの近道そのものの使用ではなかったと主張しています。
ここで、私たちは根本原因分析が行われていないことを見て取れます。アッシュボー（ペティ）の引用が舞台を設定します。彼らはペティのアイデアを失敗の潜在的な原因として疑問視するのではなく、むしろ彼のアイデアを称賛し、次に進んで、間違いは単にP/F閾値によって疾患をひとまとめにした選択にあったと見つけます。
この単純な間違いを発見したことで、彼らは解決策は簡単だと認識しています。彼らが必要なのは、PettyBone RCT方法論の下でRCTのために疾患をひとまとめにするための他の測定基準を見つけることだけです。そこで彼らはこの作業のためにML/AIに目を向けます。MLによって生成された、PettyBone RCTのためにひとまとめにされた異なる疾患のトリアージ捕捉により、RCTは永遠に流れ続けることができます。
これは、ブラッドフォード・ヒルに基づく特定の疾患を診断するというボトルネックが回避され、MLによって生成された単純なトリアージ尺度に置き換えられるため、RCTの数を増やすのに最適です。
ARDSに対する次の薬を検証することは、新しい標準的な疾患ひとまとめ測定基準を使えば、誰にとってもこれまで通り簡単なままでしょう。単一の疾患診断は一切必要ありません。もちろん、これらのRCTはすべて失敗しましたが、彼らはその理由を見つけたと考えています。
これらすべては、おそらく後で疾患をサブフェノタイプに分けるなどして、各疾患（インフルエンザAなど）について個別にブラッドフォード・ヒルRCTを行う必要があることを受け入れる代わりのものです。
しかし、彼らは自分たちのPettyBone合成症候群ドグマに違反するため、疾患の診断について言及することさえできません。
この論説が、特定の疾患に対するRCTを用いて治療を検証するというブラッドフォード・ヒル法から再び遠ざかるように教えていることに注意してください。
彼らは統計家からの助けを必要としています。
SpringerLink：ガッティノーニの遺産：生理学を通じたARDS管理の個別化 - ...
Intensive Care Medicine -
いいね：1件
28. 投稿#37 (llynn)

llynn、2025年1月27日 10:05pm、投稿#37
エドワード、思慮深いご意見をありがとうございます。あなたは、何十年にもわたって広められてきたクリティカルケアのPettyBone「ひとまとめ」パラダイムに対する標準的な議論を、見事に提示してくださいました。その議論が具体的にどのようなものかを皆が目にすることができて、大変有意義です。それは、雑誌『Critical Care Medicine』に掲載されれば、高く評価される論説となるでしょう。
しかし、ここは統計学とデータ手法のフォーラムですので、あなたが提供してくださった以上の特異性を求めることになります。あなたが留まり、私が以下に示す分析で認識した誤りを訂正することで、その特異性をもたらしてくださることを願っています。あなたは次のように述べています。
Doc_Ed:
敗血症は不均一な症候群です。非常に不均一な症候群です。非常に、非常に不均一な症候群です。
承知しました。クリティカルケアの科学者たちが「不均一症候群（heterogenous syndrome）」という用語が意味のあるものだと考えていることは知っていますが、ここは『Critical Care Medicine』や『Blue Journal』の論説ではなく、データ手法のフォーラムなので、私たちは曖昧な専門用語を使う余裕はありません。私たちがあなたを理解するためには、あなたがクリティカルケアの標準用語である「不均一症候群」で何を意味するのかを客観的に定義していただく必要があります。
形容詞の「不均一な（heterogenous）」は曖昧であり、名詞の「症候群（syndrome）」も曖昧です。したがって、「不均一症候群」というフレーズは、言語学的に、2つの曖昧な言葉の産物であり、ある意味で「曖昧さの二乗」です。これは軽薄な判断ではありません。なぜなら、クリティカルケアの科学者たちが統計家に、数学を用いて再現可能な結果を出すように研究を依頼しているのは、まさにこの曖昧さの二乗だからです。
ここに、「不均一症候群とは何か？」という問いへの答えがあります。
私の答え：不均一症候群とは、疾患にとらわれない（disease agnostic）の数学的集合であり、第二の数学的集合である非疾患特異的閾値の範囲内に収まる、数十から数百の異なる疾患からなります。**
（この第二の閾値の集合は、一人またはコンセンサスを形成するグループによる最善の推測として決定されるか、あるいは機械学習によって定義されることができます。世界中のRCTで使用されるこの標準的な第二の閾値セットは、選ばれたコンセンサスグループのタスクフォースによってのみ修正可能ですが、これらの修正された閾値セットは以前の閾値セットと重複する必要はありません。言い換えれば、タスクフォースは過去に積み上げる必要はなく、新たに推測することができるのです。）
さて、クリティカルケアの科学者たちが過去30年間にわたり「不均一症候群」に対する治療法を検証してきたことを確立したので、私たちは彼らが実際に何に対する治療法を検証してきたのか、全く分からないことは明らかです。さらに悪いことに、彼ら自身も分かっていません。
このため、「不均一症候群」の検証に関する議論は、数学を用いて「曖昧さの二乗」を研究し、実用的で再現可能なアウトカムを導き出すことは不可能であるため、追うことができません。実際、それを考えると、エドワード、あなたが次のように言うのは驚くことではありません。
Doc_Ed:
私は、それらのいずれかが広すぎたとは必ずしも思いません。
確かに、PettyBoneパラダイムの下では、RCTの広範さは定義不可能です。
もちろん、世界は複雑であり、仕事は困難であるという議論は、PettyBone RCTを継続するための言い訳にはなりません。聡明なブラッドフォード・ヒルは、アウトカムが測定可能である単一の疾患の単一の表現型を検証するために方法を絞り込むことによって、複雑さに取り組む方法を示しています。
クリティカルケア科学の一部が、今や標的を絞り込んでいることは称賛に値しますが、世界の大多数のクリティカルケア科学者や統計家は、SOFAやARDSの閾値セットを用いてRCTで「ひとまとめ」にするための行進命令を受けています。少数のエリートがようやくPettyBone RCTが病理科学であると認識し始めている一方で、世界の残りの人々が、これが病理科学であることを開示せずに、標準的な研究であるPettyBoneの「ひとまとめ」ガイドラインを用いて自らを苦しめさせていることは、事態を緩和するものではありません。
あるクリティカルケア科学者は、不均一症候群は「我々がただ知っている」何か、一種の社会学的構築物であると主張するかもしれません。しかし、不均一症候群の第一の疾患セットを捕捉するために世界標準として公布されてきた第二の閾値セットの各構成は、それさえも真実ではないことを証明しています。SIRS（1989年から2015年まで続いたボーンの最初の閾値セット）は、現在研究の世界標準として公布されているSOFAのシグナルとも閾値とも、数学的または生物学的な類似性を持ちません。さらに、現在の標準的なARDS閾値セットは、2012年にベルリンで推測されたセット（2020年のパンデミック中に失敗した）とほとんど類似性がありません。
パンをいつでも薄くスライスできるという議論は、真実ではありますが、「ひとまとめ」にされた曖昧さの二乗を研究するための議論にはなりません。確かに、あなたはPettyBone RCTとブラッドフォード・ヒルRCTの間に二分法はないと主張しています。私は反対です。SIRSやSOFAを用いた敗血症RCTは、PettyBoneスペクトラムの極端な端に位置し、ブラッドフォード・ヒルの教えに完全に反対するものとして定義されます。それは不均一症候群の研究、言い換えれば、曖昧さの二乗に対する治療法を検証するRCTです。しかし、PettyBone RCTがどれだけうまく機能するかをフィッシャーやヒルに尋ねる必要はありません。私たちには30年以上にわたる証明済みの失敗があります。
確かに、不均一症候群に対する治療を検証するRCTを用いることから離れれば、スペクトラムが存在することには同意します。CAPE-COD試験は、PettyBoneの敗血症やARDS試験よりも、はるかにブラッドフォード・ヒル側にあります。確かに、細菌性肺炎の研究は診断的に不可知ではありません。しかし、エリンが指摘するように、そこには依然としてPettyBoneの「ひとまとめ」の要素があり、情報を得た臨床医なら誰でもベッドサイドでかなりの躊躇を覚えるはずです。
私が2012年にソーシャルメディアで「ひとまとめ」に対するこのキャンペーンを始めたとき、「思想的指導者」たちはドグマのあまりにも深いところにいたため、ボーンが推測したSIRSを積極的に擁護していました。彼らは、自分たちが曖昧さの二乗に対する治療法を検証するPettyBone RCTを行っていることにさえ、全く気づいていませんでした。「不均一症候群」のような専門用語を用いて、彼らは自分自身を欺き、若者を教化しました。私たちは皆、過去にこれを行いました。
あなたのチームや他のクリティカルケア科学の人々が今、PettyBoneドグマの愚かさに気づき始めていることは、確かに進歩ですが、論説や議論はもっと率直であるべきです。過去の過ちを認め、不均一症候群がブラッドフォード・ヒルRCTのためのよく考えられた「疾患等価物」であると信じ込ませてきた統計家たちに真実を教えるべきです。
あなたが示唆するように、私はこの問題に偶然出くわしたわけではありません。私は、クリティカルケア科学の歴史とそのドグマを探求し、その失敗を理解するために、包括的な根本原因分析を行いました。基本的なドグマ（PettyBoneRCT方法論など）の根本原因故障分析は、若いクリティカルケア科学者たちが教えられることではありません。また、私が最初に警告を発したわけではありません。名呼吸器科医のマレーは、1975年の論説で、ペティの「ひとまとめ」のアイデアは健全ではないと主張しました。
クリティカルケアの一部の人々が今、自分たちに問題があることを認識しているのは事実ですが、彼らはそれを根本原因分析のプロセスによって公の場で検証しません。もしそうすれば、彼らは皆、私たちが病的コンセンサスによる病理科学を実践してきたことを見て取るでしょう。
10年以上前、私はかつてドグマを信じ、これらのことを教えていました。SIRS（ボーンは私の同時代人でした）や、もちろんRCTの「ひとまとめ」ツールとしてのSOFAを教えたことはありませんが、それでも最初は、ボーンのメチルプレドニゾロン試験は良いアイデアで意味のあるものだと思っていました。私たちは皆、教化されていましたが、今や、次の指導を受ける者たちに同じことが起こらないように、完全な真実を伝えなければなりません。私たちは一般市民を救わなければなりません。クリティカルケア科学の政治的配慮は無関係です。
私たちが変えるべきものを特定するという点について、私は、クリティカルケア科学が妥当だと考えている標準的な専門用語が非常に曖昧であるため、RCT自体の数学的関数レベルでの議論が全く不可能であることを見出しました。議論や討論、賛否両論のセッションは、本物に見えながらも表面的であり続けます。私はこれに名前を付けています。これは、「合成症候群」に関する「合成討論」です。統計家たち、そして実際、討論者たち自身が、不均一症候群が客観的な生物学的実体であると信じ込まされています。
「曖昧さの二乗」が依然として妥当な専門用語である限り、根本原因分析は不可能です。
エドワード、この議論/討論への素晴らしい貢献に感謝します。あなたが留まり、対話を続けてくださることを願っています。あなたの同僚を送ってくださることを願っています。このPettyBone RCTスレッドは3000人以上の読者がいるので、あらゆる側面からの完全な議論が重要です。私たちは彼らのコメントも楽しみにしています。
いいね：1件
29. 投稿#39 (Lawrence_Lynn)

Lawrence_Lynn、2025年1月28日 6:48am、投稿#39
エリン、ありがとう。私たちは、失敗したPettyBoneパラダイムの黙認段階の初期にいると思います。エドのグループは初期の移行者かもしれませんが、この分野では依然として、PettyBone RCTのために異なる疾患を捕捉するための次の一連の閾値を決定するためにタスクフォース会議が開かれています。
タスクフォースは、約6ヶ月前に小児敗血症のためのPettyBone RCTに関する新しい世界的な閾値セットを発表しました。エドワードの認識にもかかわらず、そのコンセンサス声明にはPettyBoneの落とし穴についての言及はなく、敗血症という不均一症候群の存在を示す2ポイントを与えるためにMLが特定した乳酸値は「10.9以上」でした。したがって、PettyBoneの落とし穴に関する教えは広まっておらず、世界規模では広く知られていません。
したがって、「不均一症候群」は、1989年当時と同様に、依然として疾患にとらわれない第一の数学的集合であり、第二の数学的集合である非疾患特異的閾値の範囲内に収まる、数十から数百の異なる疾患からなります。
ですから、議論の激しさに対するあなたの配慮を受け入れつつも、勝利の兆しは手を緩める合図ではありません。
PettyBoneの間違いを認めてほしいという願望は、復讐のためではなく、善意ではあるが教化され、家父長的なリーダーたちが「SEPSIS 3」（SOFA）やPettyBone RCTパラダイムのようなコンセンサスルールを強制するために助成金を管理することで主張してきた（そして今も主張している）中央集権的な支配から、クリティカルケア研究コミュニティを解放するためです。
一例として、私たちの助成金申請の一つで、「敗血症が何であるかについては合意がない」という点を指摘したことを思い出します。助成金の査読者は、彼女の不採択の返答で、次のように鋭く言い返しました。
「敗血症が何であるかについては合意があり、それはSEPSIS 3である」
この偉大な査読者が、敗血症として含まれる疾患を決定するためのトリアージセットとして要求しているこの閾値セットは、1996年に一人の人物によって推測されたものですが、世界の敗血症研究の調和のためのトリアージセットとしてタスクフォースによって選ばれたため、彼女は私たちが助成金を得るためにSEPSIS 3を使用することを期待していました。もちろん、SEPSIS 3は今日でも成人敗血症のPettyBone研究の標準測定として期待されているため、ほとんどの人がまだそれを使用しています。ですから、エドワードのグループは変わったかもしれませんが、リーダーたちの公式な立場は変わっていません。
これが、ほとんどの研究にとって、科学がいかに厳しく管理されているかということです。
正直なところ、私がここにいるのは、統計家たちにPettyBone RCT、合成症候群、そして偽の（推測された）測定基準（SOFAのような）についての真実を明らかにし、彼らがクリティカルケアの「測定基準」についての真実と、不均一症候群が疾患の等価物ではなく、これらの研究がブラッドフォード・ヒルRCTではないことを学んでくれることを願っているからです。
いいね：1件
30. 投稿#42 (Lawrence_Lynn)

Lawrence_Lynn、2025年1月30日 2:34pm、投稿#42
f2harrell:
一般的にRCTにおいて予後の均一性を持つことは必ずしも望ましいことではありません。しかし、私たちが必要としているのは、患者タイプ間での治療効果の均一性です。
Pubmedのレビューで「敗血症」に関連して「不均一症候群（heterogeneous syndrome）」という用語が初めて使用されたのを特定できたのは2004年からで、次のように述べられています。
「重症敗血症は、不均一な集団における不均一な症候群である」
ここでわかるように、彼らは「不均一な集団または予後」と「不均一な治療効果」の違いを理解していませんでした。
したがって、これは、予後と集団の不均一性を制御するブラッドフォード・ヒルRCTの能力に関する誤解から生じる認識エラーの根拠を示しています。それは、数十から数百の異なる疾患のセット（各セットが異なる平均治療効果を持つ）が「不均一症候群」にひとまとめにされる際に、知らず知らずのうちに大規模になりうる治療効果の不均一性とは関係ありません。
この2004年の論文は、「敗血症」と呼ばれるための測定基準を満たした疾患のセットに対する抗凝固薬治療に関するPettyBone RCTの再現性の失敗を理解しようとしていました。もちろん、彼らはこれをPettyBoneの病理科学とは認識していませんでした。
ラングミュアは、病理科学を理解し排除する上で、遠い過去の根本的な誤りを探求することが極めて重要であると教えました。この「探求と調査」こそが、信頼と擁護ではなく、すべての若い科学者の標準的な方法であるべきです。論文は、ドグマを繰り返すことから始めるのではなく、その起源と科学的根拠の深い分析から始めるべきです。
N線の病理科学において、ラングミュアの根本的な誤りは技術的な解釈上の誤りでした。
対照的に、PettyBone RCT、特に敗血症とARDSの分野において、ラングミュアの根本的な誤りは認識上の誤りでした。フィッシャーとブラッドフォード・ヒルの教えに関する、「不均一な（heterogeneous）」という用語とその数学的管理に関する単純な誤解です。
https://www.tandfonline.com/doi/10.1080/07853890410027943?url_ver=Z39.88-2003&rfr_id=ori:rid:crossref.org&rfr_dat=cr_pub%20%200pubmed
いいね：1件
31. 投稿#48 (Lawrence_Lynn)

Lawrence_Lynn、2025年1月31日 4:14am、投稿#48
「不均一症候群」について、より優れた数学的な特徴付けがあることに気づきました。以下がその定義です。
「不均一症候群」のより数学的な定義は次の通りです。『疾患にとらわれない（disease agnostic）包括的な集合体であり、それはさらに複数の異なる疾患からなる複数の下位集合で構成される。そして、どの疾患が含まれるかは、病的コンセンサスによって随時修正されるトリアージ閾値の集合によって規定される』
これは、ARDSと呼ばれる不均一症候群の包括的な集合に含まれる、対応する3つの集合に関する3つのPettyBone RCTの図です。
ここで、専門用語である「不均一症候群」が、PettyBone RCT内部で層状の治療効果の不一致をいかに隠しているかがわかります。ブラッドフォード・ヒルRCTとは全くの正反対です。
PettyBoneでは、ATE（平均治療効果）は不均一症候群のATEではなく、むしろ不均一症候群を構成する限定された疾患の集合のATEであり、ましてや治療中の個々の患者の疾患のATEではありません。
したがって、PettyBone RCTは定義可能な根本的な誤りを持つ病理科学ですが、同時に完璧な「RCT模倣品」でもあります。それはトリアージによる症例発見によって誰でも容易に生成できます。その点で、PettyBone症候群を調査する研究は、流れるスパイスであり…そしてスパイスは流れ続けなければならないのです。（デューン パート1）。
32. 投稿#49 (Lawrence_Lynn)

Lawrence_Lynn、2025年1月31日 7:35pm、投稿#49
疑似科学、病理科学、病的コンセンサス、そして真の科学の間のインターフェースを検証する2冊目の本を書くことを検討しています。
疑似科学に関しては、ある特徴が際立っています。それは、曖昧な専門用語の使用です。
疑似科学の一部は、生き残った病理科学から生まれ、一部はペテン師の次元から生まれるようです。
何十年も真の科学の内部に留まる病理科学は、「内在化された疑似科学」となります。ここで、疑似科学が真の科学の内部で共存できるのは、その用語の曖見さのおかげです。ある意味で、この曖昧さは、探究する数学者や統計学者をかわす鎧を提供します。
この内在化された、あるいは主流の疑似科学の際立った特徴の一つは、科学的語彙の進化する一般性です。
ホメオパシーは「ポテンタイゼーション（potentiation）」について語り、カイロプラクティックの科学者は「サブラクセーション（subluxation）」について語ります。睡眠時無呼吸の重症度科学は、1970年代に推測された「無呼吸低呼吸指数（apnea hypopnea index）」という計数科学に基づいており、クリティカルケアは20世紀に推測された「不均一症候群（heterogeneous syndromes）」の研究に根ざしています。
フィッシャーとヒルの間の議論を検証するのは興味深いことです。ヒルはプラグマティズム（実用主義）の擁護者でしたが、それはフィッシャーに導かれた数学の限界内でのみでした。
医師ではなく、自身も結核を患っていたヒルが、機能的に謙虚であり続け、統計学者に敬意を払いながらも、彼らが十分にプラグマティックな観点から考える能力が限られていると感じていたことを非難していたことがわかります。
しかし、ここでわかるのは、次の3世代にわたり、ヒルに代わった医師たちが、彼らのプラグマティズムを支配的な力へと強化したということです。
ここからPettyBoneの疑似科学が生まれ、別の曖昧な専門用語である「プラグマティック試験」の名の下に生き続けています。
唯一の希望は、ヒルが非難しながらも、自らの限界を受け入れて細心の注意を払って従った、統計学者のリーダーシップへの回帰です。
Chalmers, I. (2003). “Fisher and Bradford Hill: Theory and pragmatism?”. International Journal of Epidemiology . 32 (6): 922–924, discussion 924–8.
33. 投稿#51 (Lawrence_Lynn)

Lawrence_Lynn、2025年2月1日 5:22am、投稿#51
数学的および方法論的な病理が侵入した著しく複雑な問題に取り組む際には、私の意見では、その病理のタイムリーな根絶を促進するために、数学と方法論を効果的に議論する唯一の手段は、深く骨の折れる探求です。
難しいのは、誰かに参加してもらうことです。根絶は一般的に好都合ではありません。
@Doc_Edと彼の同僚、あるいはどの読者からでも学びたいのですが、この質問をさせてください：
クリティカルケアにおける「不均一症候群」に関する、あなたの実用的な数学的記述または数式は何ですか？
34. 投稿#53 (Lawrence_Lynn)

Lawrence_Lynn、2025年2月1日 1:54pm、投稿#53
f2harrell:
議論に他の角度を加えることが助けになるかもしれません。例えば、無益な臨床試験を終えることによる損失額（$）を計算する、
はい。コストと失われた機会を定量化することは困難でしょう。これを行うには、そのような技術の専門家を募る必要があります。
f2harrell:
不均一症候群の中から均一な糸口を発見するためのアダプティブ臨床試験を行う機会を逃した可能性など。
同意します。これにもっと焦点を当てるべきです。私たちは皆、不均一症候群に含まれる疾患の少なくとも一部には、そのような糸口が存在すると考えています。ARDSという不均一症候群が、界面活性剤欠乏という均一な糸口に関するペティのアイデアに基づいていたことは興味深いことであり、これが彼がブラッドフォード・ヒルRCTを行っていると考えた理由です。
研究論文の著者記載の歴史を理解しようとしています。英国医学研究会議の仕事を見ると、統計家を特定するのは困難です。PIが主導し、しばしば一般的な言葉で方法のセクションを書いているようです。歴史的に何が、そのレベルの著者としての従属と階層構造につながったのかを理解しようとしています。
統計家が共著者として記載されれば助けになると思いますか？ 例外はありますが、これは一般的なルールではなく、もし統計家が共著者であり、利益相反を排除するために別途資金提供されていれば、彼らは専門用語を数学的要素に分解し、RCTの関数を客観的に定義するようになると思われます。
PIから独立させるために、申請書内の費用としてではなく、統計家に別途資金を提供し、そして彼らが方法論の所有権を持つように共著者として記載することについてどう思いますか。
いいね：1件
35. 投稿#55 (Lawrence_Lynn)

Lawrence_Lynn、2025年2月1日 11:59pm、投稿#55
エリン、それはよく分かりません。 提示されたこのアダプティブ試験は、敗血症、ARDS、せん妄に対するPettyBone RCTを含む試験を、より効率的に実施するための手段にすぎません。
「アダプティブプラットフォーム試験は、単一の疾患または状態において複数の介入を永続的な方法で研究し、介入は決定アルゴリズムに基づいてプラットフォームに出入りすることが許可される」（強調は筆者）。
彼らは「状態（condition）」と言っていますが、これは「不均一症候群」を指しています。
ここにはいくつかのブラッドフォード・ヒルRCTがありますが、これもまたPettyBoneの病理科学をより簡単に行うための道筋にすぎません。
ここにはPettyBoneの病理や、なぜ40年間の研究が失敗したのかについての教えや修正はありません。不均一性については多くの話がありますが、その特異性は「不均一症候群」という言葉の中にある特異性と同じくらいです。
これがまさに問題なのです。クリティカルケア科学は、単に効率的になるだけでなく、より病的でなくなる必要があります。
一般市民は、ゆっくりと管理された「パラダイム・ドリフト」にお金を払うべきではありません。
一般市民にとって最善のことは、私たちがオープンな故障モード分析を行うことです。私の意見では、過去を振り返ることを避ける権利はありません。なぜなら、それが私たちの病理科学を理解し、研究し、根絶する唯一の方法だからです。
PettyBone研究を行うアダプティブ試験は、40年間の失敗の後、同じPettyBone科学者たちに一般市民のクレジットカード番号を渡すことと等しいです。
いいね：1件
36. 投稿#56 (Lawrence_Lynn)

Lawrence_Lynn、2025年2月2日 2:17pm、投稿#56
エリン、あなたが引用した2024年の論文（将来を見据えたもの）は、クリティカルケア科学における文化の問題、そして内省と自己監視の欠如の問題を示すのに最適です。
その論文は、40年間の失敗に対する以下の最初の答えです。

「この方法論は機能してこなかった。そして我々はXを行うつもりだ。」

一般市民は、以下の2番目の答えを私たちから得るに値し、またそれを信頼しています。私たちは、便宜性に関係なく、科学を迅速に修正するという最善の利益に沿ったものを、自発的に彼らに提供しないと決定する権利はありません。それは、私たちが2つのことをしなければならないことを意味します。第一に過去を振り返り、第二に過去を振り返って学んだことを用いて未来を見据えることです。以下が、一般市民が受けるに値し、私たちがきっと行うだろうと確信している2番目の答えです。


「この方法論は機能してこなかった。これらは、我々の過去および現在の標準的な方法論、その起源、そして我々の専門用語の数学的意味について、専門の統計学者（一部は分野外から）からなる委託パネルによる包括的な根本原因故障モード分析の結果であり、彼らは以下のことを発見した。我々は、方法論を修正し改善するために、以下の点を修正することを提案する。」


投稿#58 (Lawrence_Lynn)


Lawrence_Lynn、2025年2月2日 7:36pm、投稿#58
エリン、あなたが善意で言っているのは理解しています。あなたが去ってしまうのは確かに残念です。この投稿に続いて、PettyBone科学の代替案についての議論をします。
私が20年間も必死に必要とされている改革を訴えてきたのに、「認識が固着している」と中傷されるのは、全く驚くことではありません。
これは、OSA（閉塞性睡眠時無呼吸）の重症度に関する失敗した「計数科学」を義務付けていた人々から受けたのと同じ扱いです。このフォーラムの別の場所で議論したように、その管理された科学分野にはAHI（無呼吸低呼吸指数）に代わるよく知られた代替案が豊富にありますが、PettyBone科学に代替案があるのと同じように、代替案の存在は、凝り固まったドグマと資金の両方を握る人々には何の影響も与えません。この意味で、トーマス・クーンはその組み合わせの相乗効果を予期していなかったかもしれません。
私は1990年代初頭にドイツのマールブルクで計数科学の代替案について講義しました。下の論文の著者の一人であるトム・ペンゼルは変革の擁護者でした。米国外の多くの人々は、それが米国とNIHに基づく病理科学であることを知っており、笑っています。
PubMed：無呼吸・低呼吸指数の盛衰について：歴史的レビューと...
1970年代のGuilleminaultらによる「睡眠時無呼吸症候群」の発表は、深刻な健康への影響を伴う新しい疾患実体の発見を画期的に示しました。閉塞性睡眠時無呼吸は、...の中でも最も重要な障害であることが示されました。
ですから、私はOSAの思想的指導者たちが間違っていたと認識したように、PettyBoneの「ひとまとめ」科学の提唱者たちも間違っていると認識しています。科学者はリーダーシップに盲従すべきではありません。
「根本原因故障モード分析」は、形式的で確立されたプロセスです。それは曖昧な要求ではありません。 これは、設定に関わらず失敗があった場合に行われるべきことです。これはFAA（連邦航空局）が常に行っていることです。
しかし、一般市民にどちらを期待するか尋ねてみましょう。以下の答え1か2か。

「この方法論は機能してこなかった。そして我々はXを行うつもりだ。」
「この方法論は機能してこなかった。これらは、我々の過去および現在の標準的な方法論、その起源、そして我々の専門用語の数学的意味について、専門の統計学者（一部は分野外から）からなる委託パネルによる包括的な根本原因故障モード分析の結果であり、彼らは以下のことを発見した。我々は、方法論を修正し改善するために、以下の点を修正することを提案する。」

私は、今もなお存在するが全く愚かな睡眠時無呼吸重症度の計数科学を打ち負かすことに失敗した経験から、多くを学びました。私は、再び同じような敬意を払い、希望に満ちた過ちを犯すつもりはありません。

  
## 051-110.md

      
    Raw
  

              051-110.md
            
          
    ソース: https://discourse.datamethods.org/t/the-petty-bone-rct/22077

Datamethodsフォーラムディスカッションの翻訳と分析：Petty/Bone RCTの病理学的科学


1. 序論：クリティカルケア研究における根本問題の提起 (#51 - #59)

導入
本セクションは、Lawrence_Lynn氏がDatamethodsフォーラムに投じた一連の初期投稿の翻訳・分析から始まる。これらの投稿は、単に議論の口火を切っただけでなく、クリティカルケア研究に深く根付いた「病理」の存在を告発し、その後の数十年にわたる議論の枠組みを決定づけるという、極めて重要な修辞戦略（rhetorical strategy）を内包している。ここでLynn氏は、問題の核心として特定の研究手法（後に「Petty/Bone RCT」と命名される）を暗に示しつつ、統計学者の資金的・知的な独立性の確保や、失敗した研究に対する「根本原因の失敗モード分析」の義務化といった、具体的かつ抜本的な改革案を提示する。これらのテーマを議論の冒頭で設定することにより、氏は、長年のドグマを解体し、分野全体の自己修正を促すための論理的基盤を構築している。
1.1. 投稿#51：議論の提起と「異種症候群」の数学的定義への問いかけ

投稿#51
数学的・方法論的な病理が侵入してしまった著しく複雑な問題に取り組む際には、私の考えでは、その病理の速やかな根絶を促進するために数学と方法論を効果的に議論する唯一の手段は、深く掘り下げて徹底的に検討することです。
難しいのは、誰かに参加してもらうことです。根絶は一般的に都合の良いものではありません。
私は@Doc_Ed氏とその同僚の方々、あるいはどの読者からでも学びたいと思っており、彼らにこの質問を投げかけます：
クリティカルケアにおける「異種症候群」についての、あなたの実用的な数学的記述または数式は何ですか？
1.2. 投稿#53：統計学者の役割と資金提供の独立性に関する提案

投稿#53
f2harrell氏の投稿より： 議論に他の角度を加えることが助けになるかもしれません。例えば、無駄な臨床試験を終えることによる損失額を計算する、など。
はい。コストと失われた機会を定量化するのは難しいでしょう。これを行うには、そのような技術の専門家を募る必要があります。
f2harrell氏の投稿より： 異種症候群の中の均質なスレッドを発見するためのアダプティブ臨床試験を行う機会を逃した可能性、など。
同意します。私はこの点にもっと焦点を当てるべきです。私たちは皆、異種症候群に含まれる疾患の少なくとも一部には、そのようなスレッドが存在すると考えています。ARDSという異種症候群が、サーファクタント欠乏という均質なスレッドに関するPettyのアイデアに基づいていたことは興味深いです。だからこそ彼は、自分がBradford Hill RCTsを行っていると考えていたのです。
私は研究出版物の著者記載の歴史を理解しようとしています。英国研究評議会の研究を見ると、統計学者を特定するのは困難です。我々は、主任研究者が主導し、しばしば一般的な言葉で方法論のセクションを執筆しているのを目にします。歴史的に何が、そのレベルの著者記載における従属と階層構造をもたらしたのかを理解しようとしています。
統計学者が共著者として記載されることが助けになると思いますか？例外はありますが、これが通例ではありません。そして、もし統計学者が共著者であり、利益相反を排除するために別途資金提供されていれば、彼らはRCTの機能を客観的に定義するために、専門用語を数学的な構成要素に分解するでしょう。
主任研究者から独立させるために、申請書内の費用としてではなく、統計学者に別途資金提供し、そして方法論に対するオーナーシップを持たせるために彼らを共著者として記載することについてどう思いますか？
1.3. 投稿#55：アダプティブプラットフォーム試験への批判と失敗モード分析の提唱

投稿#55
Erinさん、私はそれに賛成できません。 この提示されたアダプティブ試験は、敗血症、ARDS、せん妄に対するPettyBone RCTを含む試験を実施するための、より効率化された手段に過ぎません。
「アダプティブプラットフォーム試験は、単一の疾患または状態において複数の介入を永続的な方法で研究するもので、決定アルゴリズムに基づいて介入がプラットフォームに参加したり離脱したりすることが許される」（強調は筆者による）。
彼らが「状態（condition）」と言っていることに注意してください。しかし彼らが言及しているのは「異種症候群（heterogeneous syndrome）」です。
ここにはいくつかのBradford Hill RCTも含まれていますが、これはPettyBoneの病理学的科学をより簡単に行うための道筋に過ぎません。
ここにはPettyBoneの病理や、なぜ40年間の研究が失敗したのかについての教訓も修正もありません。「異質性（heterogeneity）」については多くの話がありますが、その具体性は「異種症候群」という言葉が持つ具体性と同程度です。
これこそが問題なのです。クリティカルケア科学は、単に効率的であること以上に、より病理的でなくなる必要があります。
公衆は、ゆっくりと管理された「パラダイム・ドリフト」にお金を払うべきではありません。
公衆にとって最善のことは、我々がオープンな失敗モード分析を行うことです。私の意見では、過去を振り返ることを避ける権利は我々にはありません。なぜなら、それが我々の病理学的科学を理解し、研究し、根絶する唯一の方法だからです。
PettyBone研究を行うアダプティブ試験は、40年間の失敗の後、同じPettyBoneの科学者たちに公衆のクレジットカード番号を渡すことと全く同じです。
1.4. 投稿#56：クリティカルケア科学における内省の欠如と公衆への責任

投稿#56
Erinさん、あなたが引用した2024年の（将来を見据えた）論文は、クリティカルケア科学における文化的問題と、内省および自己規律の欠如という問題を実証するのに完璧です。
その論文は、40年間の失敗に対する、以下の最初の答えです。

「この方法論は機能しなかったので、我々はXを実行するつもりだ」。

公衆は、我々が以下の2番目の答えを彼らに与えることを期待し、信頼しています。我々は、都合の良さを考慮せず、科学を迅速に修正するという最善の利益にかなうことを、意志の働きとして彼らに与えないと決定する権利はありません。それはつまり、我々が2つのことをしなければならないということです。第一に過去を振り返り、第二に過去を振り返って学んだことを用いて未来を見据えることです。ここに、公衆が受けるべきであり、我々が間違いなく行うと確信している2番目の答えがあります。

「この方法論は機能しなかった。これは、（分野外の専門家も含む）専門統計学者の委託パネルによる、我々の過去と現在の標準的な方法論、その起源、そして我々の専門用語の数学的意味に関する包括的な根本原因の失敗モード分析の結果である。我々は方法論を修正し改善するために、以下の点を修正することを提案する。」

1.5. 投稿#58：過去の教訓と「根本原因の失敗モード分析」の重要性

投稿#58
Erinさん、あなたが善意で言っていることは理解しています。あなたが去られるのは確かに残念です。この投稿に続いて、PettyBone科学の代替案についての議論をします。
私が20年間も切実に必要とされる改革を訴えてきたのに、「認知的に固執している」と軽蔑されることは、全く驚くに値しません。
これは、OSA（閉塞性睡眠時無呼吸症）の重症度に関する失敗した「計数科学」を義務付けていた人々から受けたのと同じ扱いです。このフォーラムの別の場所で議論したように、その管理された科学分野にはAHIに代わるよく知られた代替案が豊富にありますが、PettyBone科学に代替案があるのと同じように、代替案の存在は、凝り固まったドグマと資金の両方を握る人々には何の違いももたらしません。この意味で、トーマス・クーンはその組み合わせの相乗効果を予期していなかったかもしれません。
私は1990年代初頭にドイツのマールブルクで計数科学の代替案について講演しました。以下の論文の著者の一人であるトム・ペンゼルは変革の擁護者でした。米国外の多くの人々は、それが米国とNIHを拠点とする病理学的科学であることを知っており、彼らは笑っています。
だから私は、OSAの思想的指導者たちが間違っていたと認識したように、PettyBoneのひとまとめ（lumping）科学の提唱者たちも間違っていると認識しています。科学者はリーダーシップに盲従すべきではありません。
「根本原因の失敗モード分析」は、形式的で確立されたプロセスです。それは曖昧な要求ではありません。 これは、状況に関わらず失敗があった場合に行われるべきことです。これはFAA（連邦航空局）が常に行っていることです。
しかし、公衆にどちらを期待するか尋ねてみましょう。以下の答え1か2か。
「この方法論は機能しなかったので、我々はXを実行するつもりだ」。
「この方法論は機能しなかった。これは、（分野外の専門家も含む）専門統計学者の委託パネルによる、我々の過去と現在の標準的な方法論、その起源、そして我々の専門用語の数学的意味に関する包括的な根本原因の失敗モード分析の結果である。我々は方法論を修正し改善するために、以下の点を修正することを提案する。」
私は、いまだに現存するが全く愚かな睡眠時無呼吸の重症度に関する計数科学を打ち負かすことに失敗した経験から多くを学びました。私は二度と、同じような敬意を払った、希望的観測に基づいた過ちを犯すつもりはありません。
1.6. 投稿#59：研究パラダイム変革のための3つの具体的ステップ

投稿#59
約束通り、なされるべき変更について説明します。
ESMD氏の投稿より： ある勇敢な統計学者（または統計学者のグループ）が、明日、あなたの臨床の同僚たちが長年にわたってどれほど間違っていたかについての長い記事を発表したと仮定しましょう
まず、あなたはご存じないかもしれませんが、私の同僚の非常に多くは、「タスクフォース、RCTのためのトリアージ閾値セット、生成者」ではなく、私に同意しています。ご存知の通り、声を上げるのは得策ではありません。
ですから、おそらくこれがあなたの意図だったのでしょう。もしそうなら、「脱帽」です。なぜなら、あなたの引用は最も重大な根本問題を美しく露呈しているからです。この問題とは、現在のクリティカルケア科学の文化では、反ドグマ的な記事を発表するには勇気が必要だということです。対照的に、ラングミュアが称賛したウッドの時代には、これは名誉の証でした。科学の規律を正すことは、全員の責任でした。今では、新しいコンセンサスとタスクフォース階級の文化のもとでは、キャリアを危険にさらすことになります。
そこで、あなたが提案するように、タスクフォース階級の中央集権的な支配という、社会的な家父長的・家母長的なバブルを突き破ることができると仮定して、取るべきステップを以下に示します。

NIHが取るべき最初のステップは、統計学者が主任研究者（PI）とは独立して資金提供されることで、彼らに主導権を与えることです。彼らは共著者となり、方法論に責任を持つことになります。彼らはPIを含まないプロセスによって選ばれます。もし統計学者が測定の根拠を含む全機能に責任を持つならば、当然、彼女は「異種症候群」のような専門用語を調査し、それらを数学に変換するでしょう。それはパラダイムを非常に迅速に変えるでしょう。根源的な誤り（apical error）は排除されます。
ハレル教授が指摘するように、RCTの数学的機能の極めて重要な部分は、「均質なスレッド」の存在です。このスレッドの欠如が根源的な誤りですが、この誤りは主任研究者たちによって認識されておらず、これが現在のPettyBone時代を生み出しました。
そのように権限を与えられた統計学者たちは、PIがひとまとめにする根拠を十分に調査したと仮定するのをやめるでしょう。そして彼らはPIと共に、この共通のスレッドが存在することを保証するでしょう。
ここで、PettyBone RCTとBradford Hill RCTの違いは、後者における均質なスレッドの存在であることがわかります。
均質なスレッドを保証する伝統的な手段は、ヒルによってよく説明されました。しかし、科学は進歩したので、均質なスレッドは、多くの手段によって被験者全員に共通する測定可能な根本的病理であるかもしれません。ペティとサーファクタントの場合のように、その仮説に確固たる発見に基づく根拠があれば、仮説上の共通スレッドでさえあり得ます。しかし、ペティやボーン、そして何十年にもわたるトリアージ閾値を生成するタスクフォースのように、単に推測でひとまとめにすることはできない、さもなければそのスレッドは疾患の混合物の中で失われてしまうということを、我々は悲しいかな学んでしまったのです。
NIHが取るべき第2のステップは、非疾患特異的な閾値セットのコンセンサスを生成するタスクフォースへの資金提供を即時停止することです。これが、33年間にわたる病理学的コンセンサスの源であり、何十年にもわたるクリティカルケアのPettyBone RCT失敗の主要な原因です。RCTのためのトリアージ閾値セットの「基準」を推測することによって世界のRCT資金提供を統一しようとする試みは、33年間のPettyBone病理の、血が滴る開いた傷口です。いかなる病理を治す際にも発生源の制御が必要であり、10年ごとに繰り返されるこれらのタスクフォース、デルファイ法（推測）によるトリアージ閾値セットのコンセンサス会議が、その発生源です。資金は、共通のスレッドを発見しようとする専門家の会議に振り向けられるべきです。
PettyBoneの推測リーダーたち（非特異的な閾値に基づくひとまとめ科学を推測する人々）の会議は、基礎研究および臨床発見の科学者と専門統計学者の会議に置き換えられるべきです。
我々は、失敗したPettyBoneパラダイムの理由が、驚くほど利他的で「勇敢な統計学者たち」によって広められたと仮定しているのですから、クリティカルケアを前進させるための若き天才たちの無数の光を解き放つという第3のステップは、この理想化された利他的なパラダイムの中ですでに起こっていることでしょう。
この公布により、基礎研究室で、データベースで、そしてベッドサイドでの均質なスレッドの探求が力づけられ、これらの探求は、発見されたスレッドをタスクフォース階級のコンセンサスによる推測に結びつける必要がなくなります。この一部は「治療可能な特性（treatable traits）」アプローチで現れつつありますが、世界の科学者たちは、タスクフォースの布告に関係なく、そのようなスレッドを探求するために解放されなければなりません。過去の家父長的な教化および知的植民地化により、PettyBoneの誤りを抱える米国のクリティカルケア科学は、このカタルシスをもたらす公布を、遅滞なく世界の他の地域に対して行う義務があります。なぜなら、この解放は、世界の他の地域の、信頼し知的植民地化されたクリティカルケア科学者たちに、遅滞なく真実のすべてが語られた場合にのみ起こるからです。

したがってErinさん、修正は簡単です。なぜなら、この病理学的科学の根源的な誤りは、根本的な均質スレッドの必要性への焦点の、単純な喪失だからです。
では、PettyBoneの根源的な誤りが排除された後、この議論はどこへ向かうべきでしょうか？
クリティカルケア研究コミュニティ全体が、善意ではあるが家父長的な異種症候群の擁護者たちの中央集権的支配から解放され、支配権が個人として、そして全体としてのコミュニティ全体に移譲され、議論が次のように転換したとき、
「均質なスレッドを構成するものは何か？」 へと、
「新しいコンセンサス・タスクフォースが導き出すトリアージ閾値セットは何か？」 から転換したとき。
それが起これば、そしてそれは起こるでしょう、なぜならこの改革は遅らせることはできても止めることはできないからです、私の反ドグマ的な努力はもはや必要なくなるでしょう。
移行文
このセクションで提起された根本的な問題意識と改革案は、次に、その批判の対象である「Petty/Bone RCT」の具体的な定義と、それがいかにして「病理学的科学」となったのかを歴史的背景と共に詳述する議論へと深化していきます。

2. 病理の定義：Petty/Bone RCTとBradford Hill RCTの対比 (#61 - #84)

導入
本セクションでは、議論の中心概念である「Petty/Bone RCT」が詳細に定義される。ここでの分析の戦略的重要性は、単なる方法論の解説に留まらない。Lynn氏は、この「病理」に「Petty/Bone」という固有名詞を与えることで、クリティカルケア研究における漠然とした失敗感（「我々の試験はうまくいかない」）を、歴史的起源を持つ特定の、対処可能な問題（「PettyとBoneによるRCTの『修正』こそが根本原因である」）へと転換させている。この「概念の再定義」は、分野全体の議論の共通言語を確立し、具体的な改革案を提示するための不可欠な前提条件となる。理想的な研究手法である「Bradford Hill RCT」との対比を通じて、過去30年以上にわたる研究がなぜ失敗に終わったのか、その根本的なパラダイムの欠陥を明らかにする。
2.1. 投稿#61, #63, #65：「Petty/Bone」の根源的エラーの定義

投稿#61
全くその通りで、それは一部の人々が取っている方向性であり、後ろ向き研究のデータベースの大きさを考えると、初期の最大の機会の一つを提供するかもしれません。
問題は、世界の研究を統一または調和させるために、対象となる異種症候群を定義するために、ひとまとめにすることが義務付けられていることです。そのコンセンサスは資金提供に結びついています。そして、コンセンサスに基づくトリアージが異質性を組み込んでしまうのです。
これが、多くの人々が、あなたが提案しているような研究を行うために、ひとまとめにされていない白紙の状態を望む理由です。
投稿#63
私の理解では、Erinさんの要求はまさにそれでした。
ESMD氏の投稿より： 「根本原因の失敗モード分析」のような非特異的な言葉の使用を超えて、これが試験デザインにとって具体的に何を意味するのか、非常に具体的な言葉で説明してください。
私は、この議論の目標が一般的な根源的エラーに関する改革であるため、躊躇しました。この改革の関数としての具体的なデザインの問題は、専門家に任せるのが最善です。
投稿#65
@Rafael_Leiteさん、美しく明確な説明です。しかし、これは病理学的RCTの「Pettyの根源的エラー」（疾患をひとまとめにする次元）に過ぎません。
33年来の「Boneの根源的エラー」は、「どのようにひとまとめにするか」を教える第2の次元です。
Boneの手法は、（専門家の推測などによって）非疾患特異的な閾値のセットを導き出し、その導き出された閾値セットをトリアージツールとして使用して、異なる疾患をひとまとめにすることを教えます。
これらの根源的エラーをコンセンサス・タスクフォースによって組み合わせることで、「異種症候群」が生まれます。これは人為的なものであるため、我々は「合成症候群」と呼びます。
Pettyのエラー1とBoneのエラー2を組み合わせることで、コンセンサス・タスクフォースは最新の異種症候群を生成します。したがって、それは以下のようになります：
「病理学的コンセンサスによって随時修正されるトリアージ閾値セットの範囲内に収まる、第二の複数の異なる疾患セットからなる、疾患にとらわれない包括的な複数のセット。」
したがって、次のように結論付けられます：
（PettyBone RCTは、非疾患特異的な閾値のトリアージセットによってひとまとめにされた異なる疾患のセットから構成される臨床的構成物である異種症候群に適用される介入をテストする「RCTの模倣品（MIMIC）」である）。
このフォーラムで、このラングミュアの病理学的科学は知られていると示唆する人々とは対照的に、過去3年間で、PettyとBoneの両方の根源的エラーを共に用いて、世界中のRCTを調和させるために疾患をひとまとめにするためのトリアージ閾値セットを生成するタスクフォース会議が3回（3回です）ありました。彼らはRCT用に3つの新しい異種症候群を生み出しました。
彼らがまだそれを教え、資金を提供し、知的に植民地化し、そして実行しているのなら、PettyBoneの病理学的科学が知られているはずがありません。
2.2. 投稿#70, #71, #73：理想的なRCTのテンプレートとしてのBradford Hill

投稿#70
なんと素晴らしい生の科学的討論でしょう。クリティカルケアにおいて、基本的な方法論に関する生の科学的な意見の不一致が公の場で行われるのは、ビッグフットのように稀です。
しかし、これこそが公衆が受けるべきものです。CDCによると、今シーズン、インフルエンザで13,000人の患者が亡くなりましたが、重症インフルエンザ肺炎の死亡率を減らす上でのコルチコステロイドの役割（あるいはその欠如）について医師に情報を提供するRCTは存在しません。
このため、研究資金が何十年にもわたりPettyのARDSという臨床的構成物に誤って費やされてきたと理解している人々は、勲章を授与された人々が頑なで、公然と内省し改革することを拒否するとき、正当に腹を立てるのです。
対照的に、「ドグマの箱の中にいる」人々は肩をすくめ、「データは乏しい」そして「試験はこれからだ」という古典的なセリフを言います。
内省と迅速な改革を望む人々と、内省に基づかないゆっくりとしたペースに満足している人々との間のこれらの戦いは、常に存在してきました。
10年間、非常に必要とされている橋に熱心に取り組んできた2つの若いエンジニアグループが、信頼するリーダーから提供されたコンクリートが本物のコンクリートではなかったと発見したときの、正反対の気質を想像してみてください。
一方のグループは動じず、「まあいいさ、やり続けよう」と言うでしょう。もう一方のグループは、自分たちの失われた仕事と公衆への失敗に憤慨し、これが二度と起こらないように内省を要求するでしょう。
ですから、これは健全な討論であり、社会的な力が開かれた討論を妨げないときに期待されるものです。これが広く読まれることを願っています。なぜなら、クリティカルケア科学の基本的な方法論キャンプの現在の両極端な状態を白日の下に晒すからです。
投稿#71
ESMD氏の投稿より： 「根本原因の失敗モード分析」のような非特異的な言葉の使用を超えて、これが試験デザインにとって具体的に何を意味するのか、非常に具体的な言葉で説明してください。
承知しました。これがテンプレートです。特定の客観的に定義可能な疾患の、客観的に測定可能な表現型に対して治療がテストされる、ここに示されたガイドラインに従ってください。
この場合、表現型は肺結核の肺胞型です。これは今日のアメリカでは稀ですが、私のように長く呼吸器科医をしていれば、見たことがあるでしょう。昔は一般的でした。
彼が結核という疾患、さらには肺結核から下向きに表現型を分類していたことに注意してください。彼は測定可能な均質なスレッドの必要性を述べています。
Erinさん、この画期的な論文を非常によく読んでください。客観的（かつ、ひとまとめにされていない）入力測定値と出力測定値への重点に注意してください。インフルエンザA肺炎、およびその他の各肺炎について、ここのガイドラインに従ってください。
MRSA肺炎を肺炎球菌性肺炎やインフルエンザ肺炎とひとまとめにしないでください。むしろ、それぞれを別々に研究してください。誤嚥に関連する呼吸器浸潤も同様の方法で研究してください。測定の実用性に基づいて必要に応じて修正しますが、均質なスレッドを侵害しないでください。ARDSは重症度の指標であり、人工物です。
客観的な診断データが試験の早い段階で利用可能になり次第、Bradford Hill法が可能な限り最善の形で適用されるように、統計学者と協力してください。
ある疾患の治療可能な表現型が見つかった場合、他の疾患でその表現型を探し、それぞれをBradford Hill法でテストしてください。
ヒルから始めてください。そして、個々の疾患の研究に基づいた広範な有効性の客観的な証拠がある場合にのみ、ひとまとめにしたグループをテストしてください。客観的な疾患が対象となり、事前確率が定義できれば、ベイズ法を適用することができます。
それが、33年間にわたるトリアージ閾値に基づくひとまとめの近道の失敗を考慮し、専門家と協力して私が行うことであり、それは有効な技術ではなく、いずれにせよRCTの機能に反するものです。しかし、まず私はPettyBoneの間違いを広く公布し、教化された人々を解放します。この努力をもって、有効なRCTは均質なスレッドを持たなければならないことを強調します。
PettyBone RCTのような新しいRCTが選択された場合、それが再びこの分野に入る前に数学的に検証されなければなりませんが、標準的なBradford Hill RCTとの混同を避けるために、ブランディングによって別途特定されなければなりません。
投稿#73
ご貢献ありがとうございます。ご指摘の通り、これはかなりのニュアンスを伴う複雑な問題ですので、この重要な議論にはもっと多くの思慮深い参加者が必要です。あなたがBALANCE試験を特定したことは、特に示唆に富んでいます。
まず、Bradford Hillの結核治療に関するRCTの提示は、単に理想的なテンプレートを示すためのものでした。ヒルの聡明さは、現代的なレンズを通して考えるとより明らかになります。
ですから、ヒルのテンプレートから始めれば、PettyのARDSの中から迅速に診断できる特定の疾患群を特定できます。例えば、誤嚥後、熱傷後、COVID肺炎、インフルエンザA肺炎、外傷後、膵炎などです。これらはそれぞれ、多施設RCTによって個別に研究することができます。
BALANCE試験では、ひとまとめにされていますが、「PettyBone的な意味」ではありません。PettyとBoneは、非疾患特異的な胸部X線写真や非疾患特異的な閾値によってひとまとめにすることを教えました。これが、ひとまとめのインフレーションを可能にした落とし穴でした。PettyBoneに基づく研究では、その拡大に限界がありません。
BALANCE試験は、具体的に診断された菌血症を、エビデンスに基づく除外基準（ブドウ球菌や感染源コントロールの考慮など）と共にひとまとめにしています。これはBradford Hill RCTに非常に近いですが、私の見解では、臨床医にいくつかの疾患がひとまとめにされていることを知らせるために、異なるブランディングを持つべきです。そのブランディングがどうあるべきかは確信が持てませんが、私はこれらを総称して「RCT Mod（修正版）」と呼んでいます。
私が臨床医にとって絶対に必要だと考える「PettyBone RCT」というブランドは、（このRCT修正版が放棄されないのであれば）非疾患特異的なトリアージ閾値セットによる、非常に広範なひとまとめの特定のタイプを指します。
ここでのテーゼは、RCTは可能な限りヒルの方法に近づけるべきだということです。
腹腔鏡検査後の穿孔による腹部感染症が、カンジダのライン感染やトキシックショックを伴うGAS菌血症とひとまとめにされるPettyBone修正版が、真のRCTからどれほどかけ離れているかがすぐにわかります。
ですから、BALANCE試験が「その異質性の針に糸を通す」ことができたという事実は、設計者たちが可能な限り真のRCT機能に近づけようとした素晴らしい例です。
感染症には、この「インテリジェントなひとまとめ」を達成するための次元があります。例えば、@Doc_Ed氏が示唆したように、試験を特定の細菌サブセットを指定した感染源に限定することができます。
しかし、共通の経路を探すのは、単一の疾患（例：UTIを感染源とする大腸菌菌血症）から始めるのが最善かもしれません。それにより、他の疾患関連の未知の変数を、試験全体で可能な限り均質に設定できます。もちろん、これは現実世界ではありませんが、これはむしろ、エビデンスによって定義されるひとまとめに続く、均質な生物学的スレッドを見つけるための手段です。
2.3. 投稿#74, #75, #77：文化的抵抗とRCT修正版（Mod）の概念

投稿#74
Elias_Eythorsson氏の投稿より： 代替案が何なのか、少し困惑しています。そして私も、代替案を求めるこれらの呼びかけに対する反応が、奇妙に好戦的で内容がないと感じています。
これについてコメントしたかったのです。この議論が普通でないことは理解していますが、元の投稿の目的はPettyBone RCT修正版を教えることであり、代替案を議論することではありませんでした。
まず、代替案を議論する前に、実質的に軽減されていない次元を持つ非疾患特異的な閾値セットによるひとまとめの落とし穴を、読者が受け入れる必要がありました。これが、議論が元の投稿の意図に何度も立ち返った理由です。また、これが、事実上誰もが信じ、教えてきた真の基本的なドグマに挑戦がなされるときに常に生じる緊張に関連して、火花が散った理由でもあります。
一部のコメント投稿者は、PettyBone RCTのラングミュア病理学的科学の性質と関連があるかのように、PettyBoneの議論を「凍結」させ、議論を代替案にそらしたいと望んでいるようでした。
病理学的科学の状態を受け入れることなく、「代替案は何か」への逸脱が常にあります。この逸脱が内省を妨げます。
この種の火花は、コンセンサス主導のクリティカルケア科学の時代である今日では奇妙に見えますが、かつては科学において一般的でした。
セントルイスのワシントン大学での私の指導教官は、今では defunct となった「反ドグマ学会」の誇り高きメンバーでした。当時の科学者たちは懐疑論者であり、そのバッジを胸につけていたので、誰もが自分のドグマはその起源まで遡って挑戦される可能性があると警告されていました。彼の有名な言葉は、「我々はあらゆるレベルでドグマに反対する」でした。
これはかつて、「科学を行う」ための非常に生産的で非常に楽しい方法でした。指導者は羊飼いではなく、教師であるため、道は広く開かれています。対照的に、我々は皆、我々の指導者であり羊飼いであるPettyとBone、そして彼らの現在も存在する信奉者たちの意見に教化されました。道を外れたいと願う羊は、餌を与えられる可能性は低いでしょう。
今日、NIHの助成金システムは、かつて学ばれた反ドグマ主義のスキルの衰退に寄与しました。それはしばしば、ネットワーキングやコンセンサス・タスクフォース階級の昇進に関する指導者ベースの教育に置き換えられています。
これが、クリティカルケアにおける基本的な試験方法論への、深く、歴史を探る、反ドグマ的な挑戦が、2025年のクリティカルケア科学において公の場で議論されることが奇妙に見える理由の一つです。
投稿#75
GrokがRCT修正版について議論しています。 ローレンス・リンは、医学研究における誤ったブランディングの問題、特にランダム化比較試験（RCT）の修正版（mod）について論じています。彼は、すべての修正版を単に「RCT」と呼ぶことは、その価値を水増しし、臨床医を誤解させると主張しています。
彼は例として「PettyBone RCT mod」を挙げ、医学研究における混乱を避け、明確さを確保するために、RCT修正版の適切なブランディングの必要性を示唆しています。
リンは、他にどのようなRCT修正版が存在するのかを問い、BALANCE試験の修正版の命名規則を提案しており、医学文献におけるRCT用語の標準化にギャップがあることを強調しています。
投稿#77
Zarkovic博士、こんにちは。 素晴らしいご指摘です。多くの分野で、特定の疾患の分離が進まなかった場合、臨床実践は我々が皆シンドロームと呼んだ症状や臨床所見を中心に進化しました。時間が経つにつれて、特定の疾患がシンドロームから分離されていきました。心臓病学のような分野では、（CHFのような）シンドロームは一次疾患に従属するようになったため、PettyBoneはもはや問題ではありません。（ただし、MACEに関するあなたの指摘は興味深いです）。
我々は、これらのシンドロームを定義する測定値（基準）が、RCT機能に入力するには数学的に適していないことを学びました。本質的に、概念や経験則に基づくヒューリスティックは臨床的には非常に有用かもしれませんが、RCTはヒューリスティックに単純に適用することはできません。これがクリティカルケアで起こったことです。
しかし（もし私が間違っていたら訂正してください）、PCOSには高アンドロゲン血症という均質な原因となるスレッドがあり、MACEにはアテローム性動脈硬化という均質な原因となるスレッドがあるように思えます（脳卒中などの他の原因が除外されていると仮定して）。
ですから、少なくともPCOSのRCTは（適切な疾患除外を行えば）、被験者がタスクフォースによって生成された非疾患特異的な閾値のトリアージセットによって定義されるPettyBone RCTの極端なレベルにはありません。PB RCTには均質な原因となるスレッドは存在しません。
PCOSの研究においてRCTは再現性がありましたか？
あなたは、PettyBone RCT修正版が他の専門分野にも忍び寄る可能性について、見事な指摘をしています。
PettyBone RCT修正版は最も簡単なRCT修正版です。なぜなら、被験者は単にトリアージによってすくい上げられるだけだからです。症例発見や疾患診断の作業とボトルネックがなくなるため、このRCT修正版は助成金への最も簡単な道となります。
統計学者は常に、その基準が単一の疾患を捉えているのか、それとも異なる疾患のセットを捉えているのかを問うべきです。
2.4. 投稿#78, #79, #81, #82, #83, #84：現代におけるPetty/Bone RCTの実例と議論の膠着

投稿#78
このスレッドを追ってきた方々は、PettyBone RCT修正版を一度も見たことがないかもしれません。
そこで、これが古典的なPettyBone RCT修正版です。Boneでさえ、このRCTは実施しなかったでしょう。なぜなら、それは推測された閾値セットの使用を、入力だけでなく出力にまで拡張しているからです（古典的なPettyBone RCT修正版のように）。これは一種の推測された「閾値サンドイッチ」であり、元のPettyBone RCT修正版は、被験者のトリアージとして推測された閾値セットのみを使用していました。
この現在の試験は、1996年に推測されたSOFA閾値合計スコアを主要評価項目として使用しています。（この点については、クリティカルケア科学における推測に基づく閾値セットの測定ツールとしての広範な使用に関する議論も参照されたい。）
現在のIloprost研究（この多施設PettyBone RCT修正版）は、第1の推測されたトリアージ閾値セットによって捕捉された膨大な異なる疾患セットに対する治療法（Iloprost）をテストしています。主要評価項目は、第2の推測された閾値セットから構成される最大日次SOFAスコアです。
もちろん、それは失敗しました。すべてのPettyBone RCT修正版が失敗するように。
最悪なのは、Iloprostがその混合物の中に隠れている一つ以上の疾患に効果があるかもしれないということです。誰にもわかりません。
このPettyBone RCT修正版は、Boneが彼の推測したSIRSのトリアージ閾値セットによって定義された「敗血症」に対する、彼の失敗したメチルプレドニゾロン試験から35周年にあたる2024年に発表されました。
試験の考察部分で、PettyBone RCT修正版の使用が試験の限界として議論されていないことに注意してください。
ですから、最も敬意を払って言いますが、@ESMD氏と@Doc_Ed氏の、この病理学的科学は知られているという見解は正しくありません。それは深く根付いています。
投稿#79
これが、今月発表された古典的なPettyBone RCTです。SOFA（sepsis3）のトリアージ閾値セットによって捕捉された異なる疾患のセットに対してアスピリンをテストしています。アウトカムもSOFAスコアだったので、これも「PettyBone SOFAサンドイッチ」です。
PettyBone RCT SOFAサンドイッチ： 入力測定—
「敗血症は、感染が疑われるか確認され、かつSOFAスコアが2点以上増加することによって、Sepsis-3の定義に従って定義された。」
出力測定—
「主要評価項目は、0日目と7日目または退院/死亡日との間のSequential Organ Failure Assessment (SOFA)スコアの変化であった。」
もちろん、結果はすべて陰性でしたが、出血が増加したため中止となりました。（被験者の一部は害を受けました）。
（この害と無駄こそが、@ESMDさん、私が「認知的に固執している」理由です。）
これがPettyBone RCT修正版のやり方です。 薬を見つけ、仮説を立てる。
SOFAを使って患者をトリアージする。（sepsis 3） トリアージされた患者をランダム化する。
薬とプラセボを投与する。 アウトカムとしてSOFAを測定する。 これは最も簡単なRCTの実施方法です。元々はアメリカで作られました。これらのブラジル人は、この病理学的科学を使用するように知的に植民地化されたのです。
非常に悲しいことです。成功の見込みなく被験者に害を与える。それがPettyBone RCTです！
投稿#81
Elias_Eythorsson氏の投稿より： 「petty/bone」の落とし穴を避ける重症急性病態のクリティカルケア試験において、包含基準がどのようになるべきか、正直な議論をすることはできますか？理解を助けるために具体的な例から始めましょう。最近発表されたBALANCE試験についてどう思いますか？
もちろんです。そして、あなたがそうする意志があることを心から願っています。上記の敗血症に対するアスピリン試験とBALANCE試験を対比し、PettyBone RCT修正版の落とし穴をどのように避けるかについて議論しましょう。
敗血症に対するアスピリン試験（PettyBone）RCTは、SOFAという非疾患特異的な最初のトリアージ閾値セットを用いて、第二の異なる疾患セット（「敗血症」という合成症候群としてひとまとめにされる）を捕捉し、その後、このPettyBone RCT修正版を用いてアスピリンをテストし、この第二の異なる疾患セットに対するアスピリンの**単一の平均治療効果（ATE）**を生成するとされています。（これは、Boneが1989年に行ったSIRSに対する失敗したメチルプレドニゾロン試験以来、36年間にわたって敗血症とARDSのRCTが行われてきた一般的な方法です。それらは再現性がありませんでした。）

「敗血症は、感染が疑われるか確認され、かつSOFAスコアが2点以上増加することによって、Sepsis-3の定義に従って定義された。」
「ASA群の患者は、ICU退室に関わらず、1日1回200mgを経口または経腸で7日間投与された。」

これをBALANCE試験と対比してください。
「1. 血液培養で病原性細菌が陽性であると報告された時点で参加病院に入院している患者が登録対象となった…包含・除外基準の完全なリストは表S2に記載されている。…

適切とは、地域の検査室の報告に従って、その微生物が感受性を示す抗生物質治療と定義された。」

BALANCE試験では客観的な診断（菌血症）があっただけでなく、治療もその診断に特異的でした。
したがって、落とし穴は、RCTに参加するすべての患者に診断または特異的に測定可能で標的可能な均質なスレッドを持たせることによって避けられます。SIRS、Sepsis 3（これはSOFAです）、あるいは次の敗血症またはARDSのコンセンサス・タスクフォースによって生成される次の閾値セットのような、非疾患特異的な閾値のセットでは、それは単に不可能です。
投稿#82
Elias_Eythorsson氏の投稿より： 「petty/bone」の落とし穴を避ける重症急性病態のクリティカルケア試験において、包含基準がどのようになるべきか、正直な議論をすることはできますか？
@Elias_Eythorsson PettyBone RCTとBalance試験の比較に関する正直な議論を求めるあなたの要請に対する私の返信を見逃したかもしれないと思い、これを送ります。
これは非常にタイムリーで人気のあるスレッドでありトピックなので、多くの人があなたの返信と考えを楽しみにしていると思います。
投稿#83
上記の返信は@Elias_Eythorsson宛てに訂正します。
投稿#84
@Elias_Eythorsson氏が「正直な議論」のために戻ってくるとは思いません。3週間以上経っていますから。しかし、もしかしたら戻ってくるかもしれません。@ESMD氏と@Doc_Ed氏は、ともに中傷し、即座に逃げ出しました。それは驚くことではありませんでした。
このスレッドを要約します： まず、歴史を深くレビューすることで、私は1967年と1989年の複合的な根源的エラー、すなわち病理学的科学を特定しました。このエラーはPettyBone RCTと呼ばれるRCTの修正であり、それは疾患を診断する必要性をなくし、診断プロセスを、この新しい修正RCTのために第二の異なる疾患セットを（トリアージによって）ひとまとめにするための、第一の推測された閾値セットに置き換えました。
第二に、このRCT修正版が病理学的科学であり、何百ものそのようなRCTにもかかわらず、35年間再現性のある陽性結果をもたらしていないことを示しました。
他のどの業界でも、修正可能な根源的エラーの発見は、改革への行動を引き起こすエキサイティングな啓示となるでしょう。私は、クリティカルケアRCTの再現性の欠如の特定の原因が、Bradford Hill方法論の修正であったことを最初に発見しました。そして、たとえ今認識されていなくても、これはクリティカルケア科学にとって偉大な発見でした。
対照的に、医学研究における無駄の修正可能な根源的原因の私の発見は、侮辱と中傷を引き起こしました。誰もそれが病理学的科学ではないとは主張しませんでした（彼らにはできなかった）。むしろ、彼らは単にその公布が気に入らなかったのです。
このスレッドでの、数十年にわたる無駄の歴史的発端と原因の発見に対する中傷的な反応は、科学者が自分たち自身を律することは信頼できないことを示しています。
このスレッドを今終えるのは結構ですが、この実験の結果、私は「閾値セットを推測するタスクフォース」は新しいNIHによって資金提供を打ち切られなければならないと認識しました。
我々はPettyBone RCT修正版の源を断ち切らなければなりません。さもなければ、彼らは単に現状維持を続けるでしょう。
移行文
PettyBone RCTの理論的・歴史的な問題点を定義し、具体例を挙げた後、議論はさらに現代的かつ衝撃的な事例、すなわちREMAP-CAP試験の分析へと進みます。これにより、理論的な批判が現実世界でいかに重大な結果をもたらすかが示されます。

3. 解決策の模索：因果モデリングと時系列データ分析の提案 (#86 - #110)

導入
この最終セクションは、過去の失敗の批判に留まらず、未来志向の具体的な解決策を提示する。ここで提言される解決策の戦略的価値は、その方法論的転換（methodological shift）の根本性にある。Lynn氏は、形式的な因果モデリング（DAGs）の導入義務化や、電子カルテ（EMR）の膨大な時系列データの深層分析を提唱する。これは単なる研究デザインの改善案ではない。それは、クリティカルケア研究の哲学的出発点そのものを、トップダウン式のコンセンサスに基づく「異種症候群」の定義から、ボトムアップ式のデータ駆動型による「疾患の動的パターン」の発見へと、根本的に転換させるパラダイムシフトの要求である。推測から客観的データへ、というこの転換は、分野全体を支配してきた思考様式への挑戦に他ならない。
3.1. 投稿#86, #87, #89, #91：REMAP-CAP試験の失敗とパラダイムの崩壊

投稿#86
承知しました。この議論は放棄するには重要すぎます。前向きに、ポジティブなことだけを。
これは、ベルギーのブリュッセルで開催された国際集中治療・救急医学シンポジウム（ISICEM）からの、クリティカルケアにおけるRCT失敗問題をどのように解決するかについての今週の議論です。
「経路」についての議論、そして死亡率がエンドポイントである場合、合成症候群における死の原因または生物学的メカニズムを特定することについての議論に注目してください。目標は、特定の死のメカニズムを防ぐための治療効果を決定することです。
投稿#87
つい最近、急性期医療における最も衝撃的な乖離した結果の一つが発表されました。それは、重症市中肺炎に対するヒドロコルチゾンをテストしたREMAP-CAP「RCT」です。結果には、利益の確率が14.4%であるのに対し、害の確率が85.6% であることが含まれていました。
CAPE CODを含む以前のほとんどの試験が利益を見出していたにもかかわらず、これです。メタアナリシスも同様です。さらに悪いことに、以前のRCTに基づく標準プロトコルはコルチコステロイドの投与を求めているため、これは非常に評価の高いREMAP CAPによる先行RCTへの驚くべき反論です。
この結果は、REMAP CAPが有効なRCTであると実際に考えていた人々にとっては非常に衝撃的であるため、考察を読むと興味深いスピンに気づくでしょう。
このスreadを読んだ人々は、この結果を予測できたでしょう。なぜなら、REMAP CAPはPettyBone RCTであり、実際にはRCTではなく「RCT模倣品（mimic）」だからです。（ウイルス性および細菌性肺炎を含む幅広い異なる疾患が基準の下でひとまとめにされています）
REMAP CAPは、歴史上最も野心的なPettyBone RCTプラットフォームです。
このPettyBoneによる疾患のひとまとめという近道は、RCT模倣品を生み出します。それは簡単ではありますが、実際には混合物中の各疾患の真のn値を偽って高く見せます。
これは、30年以上にわたる失敗したPettyBone RCTの歴史における、また一つの失敗したPettyBone RCTであり、多くのプロトコルが害のために覆されてきました。公衆は、真のRCTとして認定されるために存在しなければならない特徴を定める基準を定義することによって、RCT模倣品を排除する行動を受ける権利があります。
投稿#89
承知しました。別のスレッドを立てることができます。おそらく良い考えでしょう。そちらにコピーします。
これは、急性期医療において非常に重要な問題です。なぜなら、これらの重症肺炎患者は、しばしば他の点では非常に健康だからです。
RCTの再現性は、敗血症やARDSの状態では非常に低かったです。我々は、市中肺炎（CAP）ではシグナルがかなり強いと考えていました。しかし、CAPは多くの非常に異なる疾患の混合物です。例えば、メチシリン耐性黄色ブドウ球菌肺炎は、臨床的に肺炎球菌性肺炎とは著しく異なり、病態生理学的にもインフルエンザA肺炎とはかけ離れています。これらはすべてCAPの下で混合されています。
あなたの考えを楽しみにしています。今のところ、この状況でヒドロコルチゾンを処方すべきかどうか、私にはわかりません。
投稿#91
将来を見据え、クリティカルケアにおける実験科学の、かつて誇り高かった自己規律と自己修正の文化に戻るためのステップを、この短いYouTubeビデオで提示します。
3.2. 投稿#92, #93, #95, #97, #99：形式的因果モデリング（DAGs）の導入提案

投稿#92
本日のサンフランシスコでのアメリカ胸部学会議での講演。
添付のツイートをご覧ください。ここで問題は、SEPSISとARDSが本日のATS講演で「薬物療法の墓場」として認識されていることとして特定されています。
しかし、提案されている解決策は、RCTで得られるATE（平均治療効果）を迂回し、個々の治療効果に進むことです。（それがどのように行われるかは私にはわかりません）。
彼らは、RCT参加者のトリアージに疾患にとらわれない推測された閾値を用いることで、捕捉された対象疾患の混合という関数として、異質性の層を丸ごと一つ追加してしまったことに気づいていないようです。
我々は彼らに、この第二の層こそが問題であり、それはBradford Hill RCTの一部ではなく、フィッシャーは種にとらわれない異なる種類の種の混合物を蒔いたわけではない、と教える必要があります。
投稿#93
将来を見据え、最近のREMAP CAPによって浮き彫りにされた現在のクリティカルケア研究の危機に対する解決策の仮説を模索するにあたり、RCTの資金提供の要件として、DAGs（有向非巡回グラフ）やその他の象徴的因果モデリングを追加することについて、どのような考えがありますか？
X（旧Twitter）で、DAGsの比較が、免疫抑制から細菌量AUC（時間領域）の増加への矢印と、ウイルス量AUCへの矢印との間に、異なるブロックが存在することを明らかにしたであろう証拠を提供しました。
過去（および現在）の過度に単純化された分析は、市中肺炎の治療としてコルチコステロイドによる免疫抑制が、細菌性肺炎とウイルス性肺炎の両方で有害な炎症を減少させるというものでした。この単純化された見解に基づき、研究者たちは市中細菌性肺炎とウイルス性肺炎の両方を、市中肺炎（CAP）という合成症候群の下でひとまとめにできると考えています。このような、形式的な因果モデリング（例えばDAGsなし）を伴わない過度に単純化された思考が、クリティカルケアの臨床実験科学を支配してきました。しかし、これらの研究は何十年も再現性がありません。
ウイルス性肺炎と細菌性肺炎の2つのDAGを描いてみましょう。
コルチコステロイド（C）から免疫抑制（I）、ウイルスAUC（V）の増加、死亡率（M）の増加へと続く連続した矢印に注目してください。
C → I → V → M
細菌性DAGでは、コルチコステロイドから免疫抑制、細菌AUC（B）の増加、死亡率の増加へと続く同様の連続した矢印が、抗生物質によってブロックされることに注目してください。
C-> I → [blocked] B-> M
これは、仮説を形式的な因果モデリングに置き換えることの落とし穴を示しています。ウイルス性肺炎と細菌性肺炎の混合比率がATEに影響を及ぼし、複数のRCTが再現不可能になるため、これらの肺炎を（REMAP CAPで行われたように）疾患にとらわれないRCTで安易にひとまとめにすることはできません。
形式的な象徴的因果モデリングとRCTの相乗効果が、何十年も見過ごされてきた微妙なラングミュアの根源的エラーを明らかにし、それらのRCTを病理学的実験科学としてしまいました。
投稿#95
こんにちは、Erinさん。このスレッドへようこそ。 はい、あなたのおっしゃる通り、私は「サークルを描く」という敗血症の考えには反対でした。それは、1989年にロジャー・ボーンによって推測されたSIRSと呼ばれる非疾患特異的な閾値のセットに過ぎず、「敗血症RCT」の参加者を選択するためのトリアージとして義務付けられていました。私は編集者への手紙でその失敗を予測しました。
ですから、RCTデザインの前に象徴的因果モデリングを行うことがなぜRCTデザインを改善しないのかを私たちに語るのではなく、私が前のコメントで描いた2つの単純なDAG（一つはインフルエンザA肺炎用、もう一つは肺炎球菌性肺炎用）が、それらを合成症候群（CAP）RCTでひとまとめにしてヒドロコルチゾン治療の有効性/害をテストすることに伴う危険、潜在的な害、そして潜在的な非再現性について警告していないのはなぜかを教えてください。
投稿#97
ああ、Erinさん。落ち着いてください。あなたには提供できるものがないので、これを個人的な攻撃に変えてしまいました。
あなたは過去に侮辱と大げさな態度でこのスレッドを去りました。私のアドバイスは、個人攻撃を避け、静かに退場することです。
ここにはあなたの興味を引く他のスレッドがたくさんあります。
投稿#99
謝罪は必要ありません、Erinさん。私が率直すぎました。 私の瀕死の患者のたとえ話で、私が微妙に手厳しかったことは認めます。
私は長年、ここDatamethodsでのあなたの思慮深いコメントから恩恵を受けてきました。時間があるときに、あなたのE.coliの質問に取り組みます。
医学は、気にかける人々にとっては簡単なものではありません。温かい敬意を込めて。
3.3. 投稿#101, #104, #105, #106：時系列データ分析と研究の出発点への回帰

投稿#101
承知しました、ハレル博士。 Erinさん、E.coli感染についてですが、私はあなたのRCTに急ぐというパラダイムを受け入れません。私たちはそのような症例を多数分析し、アーカイブしています。そして言えることは、 あなたは最初のステップを見逃しているということです：
「各疾患と、各疾患の関連性のある時系列パターンを研究する」
まず、EMRアーカイブから何千ものそのような症例の時系列データを収集し、検査値、バイタルサイン、薬物、培養、PCR、発症、悪化、治療失敗、回復の時系列パターンを検出する分析手法を開発することから始めます。
ここでの鍵は、別の盲目的な「敗血症」RCTを始める前に、各感染タイプの表現型の時系列パターンを理解することです。これらは、疾患（大腸菌性尿路敗血症）、病原体、または診断（腸穿孔）によって分析できます。
ですから、あなたは「異種症候群」から始めるのではなく、客観的な患者の関連性のある時系列シグナルから始めます。なぜなら、それが実データだからです。推測された閾値から導き出されたデータは、はかない人工物です。
投稿#104
ハレル博士、私の見解を提供し続けるよう要請していただきありがとうございます。
数百種類もの異なる進行した感染状態の研究に最適なアプローチについては、用語や目標も含めて、最初から始めるのが最善です。最初の目標は、先行要因、感染症、感染症に対する人間の反応、そして介入によって生成される、時間次元を持つ関連性のあるシグナルについて学ぶことです。
ですから、我々は1990年代スタイルのタスクフォースを招集して「敗血症」のトリアージ閾値セットを決定し、その後、トリアージされた参加者に対する薬剤X、Y、Zの治療効果を決定するために複数のRCTを開始する、ということはしません。代わりに、我々は治癒を目指す感染症について学ぶことから始めます。
代わりに、我々はまだ始まりに近いことを受け入れます。そこで、我々は人間を世俗的な視点から、シグナルの時系列マトリックスとして、そして感染とその感染への反応をそのマトリックスの歪みとして捉える、という極めて基本的なことから始めます。各感染は、シグナルの複数の摂動（検査値、バイタル、分子など）と、それらの摂動からの回復から構成される、特徴的な歪みを誘発します。それらがEMRアーカイブに数十万件あるデータなので、我々はそれらから学ぶことから始めます。
私は「人間の時系列マトリックス（human time series matrix, HTM）」のような言葉を使い、グローバルなアプローチと必須のベースライン状態（先行要因の定義）を強調してきました。より馴染みのある、しかし包括的に経済的ではない用語も適用可能です。例えば、ベースライン状態と対象疾患およびその回復の両方の関連性のある時系列パターンなどです。
投稿#105
重症感染症（敗血症）における抗生物質試験は、PettyBone試験とは見なされません。なぜなら、治療は事前の抗生物質および抗真菌薬の感受性試験によって定義された、存在する可能性が高い微生物を標的とするように選択されるからです。
ここに、敗血症研究における因果推論の使用（誤用？）に関する議論があります。ピペラシリン・タゾバクタム（ゾシン）は何十年も広く使用されてきました。
この症例は、DAGsの使用に注目してください。この種のCI（因果推論）を、PettyBoneの閾値でひとまとめにされた異なる疾患のセットに適用することの難しさに注目してください。もしこれが一つの疾患であれば、CEA（CI）研究は有効だったかもしれません。
投稿#106
将来を見据えるためには、解決すべき問題を特定する必要があります。私は、CSM（因果構造モデリング）を学ぶ上でAIが役立つことを見出しており、それは潜在的な研究の欠陥を明らかにします。この画像は、CSMを用いて現在のクリティカルケア研究の状態を議論しているChat GPTからのものです。 （画像の説明：Chat GPTがPetty/Bone RCTの根本的な欠陥、すなわち異質な疾患集団をひとまとめにすることによる因果関係の曖昧化を、因果構造モデリング（CSM）の観点からテキストと図で解説している様子。）
そこで、我々が今後修正しなければならないことが明確にわかります。
以下はGrokによる分析です。
機能的関係式とREMAP-CAPの分析
Grokは、Petty/Bone RCTの一般的な機能的関係式を定義し、それをREMAP-CAP試験に適用しています。

変数: 治療(T)、アウトカム(Y)、疾患タイプ(D)、観測された交絡因子(C)、未観測の交絡因子(U)、施設(S)、SOFAスコア、病原体量(PL)、セーフティネット(SN)などを定義。
機能的関係式: これらの変数が互いにどのように影響し合うかを数式で表現（例：D = f_D(S, U_D) は疾患タイプが施設や未観測因子に依存することを示す）。
REMAP-CAPへの適用: REMAP-CAPがSOFAスコアなどの閾値基準を用いて異なる疾患（細菌性、ウイルス性、インフルエンザなど）をひとまとめにしているため、Petty/Bone RCTの特性を持つと分析。
ATEの計算: REMAP-CAPのデータから平均治療効果（ATE）を計算。 ATE = E[Y | do(T=1)] - E[Y | do(T=0)] E[Y | do(T=1)] = 0.85 E[Y | do(T=0)] = 0.902 ATE = 0.85 - 0.902 = -0.052
結論: ATEが負の値（-0.052）であることは、ヒドロコルチゾンが全体として害をもたらしたことを示唆。これは、免疫抑制がインフルエンザのようなウイルス性疾患（抗ウイルス薬のセーフティネットが弱い）の転帰を悪化させる一方、細菌性CAP（抗生物質のセーフティネットが強い）では効果が中和される、という相反する効果を「ひとまとめ」にした結果であると結論付けています。

このすべてのポイントは、REMAP CAPを読んでも、著者たちがこれらの考慮事項のいずれかを、たとえ後からでも熟考した形跡が見られないということです。だからこそ、我々は生データの研究に戻らなければならないのです。
（画像の説明：以下は、重症感染症における患者の状態遷移と転帰を示す3つの時系列マトリックス図。）


一般的な進行パターン: 重症感染症における患者の状態が時間経過と共にどのように進行し、分岐しうるかを示した一般的な時系列マトリックス図。発症から悪化、そして回復または死亡といった複数の潜在的経路を視覚化している。


抗生物質が有効な例: 感受性の高い病原体（例：A群レンサ球菌）に対し、適切なタイミングで抗生物質（T）が投与された場合の時系列マトリックス図。治療介入により、患者の状態が一貫して回復軌道に乗る典型的なパターンを示す。


複雑で反応が悪い例: 反応性の低い病原体や複数の合併症が絡む複雑な症例における時系列マトリックス図。治療介入（T）にもかかわらず、状態が改善せず、回復不全や悪化に至る困難な経過を視覚的に表現している。


3.4. 投稿#110：結び：ドグマの崩壊と自己修正への期待

投稿#110
10年以上にわたって内省を促そうと試みた後でこれを見るのは驚くべきことです。彼らが気の毒に思えますし、過去にあれほどの自信過剰だった後で、実際にはPettyBone RCTである「祈りと希望」のRCTという特徴付けを見るのは悲しいです。
私にとって、これは素晴らしくも悲しい日です。多くの時間が失われましたが、このポッドキャストでの当惑した笑いを通して、彼らが今や古いPettyBone科学が病理的であると認識していることがわかります。
そのポッドキャストでは実際の科学はほとんど議論されていませんでしたが（ほとんどはPettyBoneの病理学的科学でした）、私はAngus博士の勇気に敬意を表さなければなりません。
フランクに特別な感謝を述べたいです。このフォーラムがなければ、これは起こらなかったと思います。このPettyBone RCTに関するスレッドは7000回以上読まれました。
私が2019年頃にdatamethodsに来た目的は、まさにこのポッドキャストで明らかな、クリティカルケア科学における内省と真の（合成的でない）パラダイムシフトを引き起こすことでした。彼らはまだ完全にそこには至っていませんが、ドグマのダムは壊れました。
次のステップは、閾値セット（X）を推測するタスクフォースを終わらせ、PettyBone科学の源と病理的性質を認めることです。
議論に参加してくださった皆さんに感謝します。科学は素晴らしいです。自己修正するときには鳥肌が立ちます。まだそこまでではありませんが、知性の水はダムを流れ始めています。

最終結論

本文書が翻訳・分析した一連のフォーラム投稿は、一人の研究者による持続的かつ論理的な問題提起が、いかにして分野全体の根深いドグマに挑戦し、最終的に自己修正の兆候を生み出すかを示す貴重な記録である。この議論は、単なる方法論批判に終わらない。それは、科学コミュニティ内部において、確立されながらも欠陥のある研究パラダイムに挑戦するための、一つのテンプレートとして機能する。
Lawrence_Lynn氏は、クリティカルケア研究の失敗の根本原因として「Petty/Bone RCT」という概念を定義し、それに名前を与えることで、漠然とした問題を具体的な標的へと変えた。次に、REMAP-CAP試験のような現代の事例を通じてその病理を鮮明にし、最終的には形式的因果モデリングや時系列データ分析といった、分野の思考様式そのものを変革する未来志向の解決策を提示した。この文書は、クリティカルケア研究の過去、現在、そして未来を考察するための批判的かつ建設的な視点を提供する、重要な方法論分析資料と言えるだろう。
No results found