TrialsBankに基づく臨床試験の運用成功を予測するための潜在リスクを考慮した機械学習アプローチ
arXiv cs.AI / 2026/4/1
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、臨床試験が開始前に運用面で成功するかどうかを、見通し(prospectively)として予測するための階層的な潜在リスクを考慮した機械学習フレームワークを提案する。
- 運用成功は、データベースロック時点までに、計画された期間、募集目標、プロトコル仕様のもとで試験を開始・実施・完了することとして定義される。
- 本手法は段階的アプローチを採用する。まず、設計時点で利用可能な180以上の「薬剤レベルおよび試験レベル」の特徴量から、中間的な潜在の運用リスク要因を予測し、その潜在リスクを用いて運用成功確率を推定する。
- 著者らは、TrialsBankの厳選サブセット(13,700件の試験)を用いて、XGBoost、CatBoost、Explainable Boosting Machinesをベンチマークし、フェーズI〜IIIにわたって強いアウト・オブ・サンプル性能を報告する(F1スコアは約0.91〜0.93)。
- 潜在リスクのドライバーを組み込むことで運用上の失敗の弁別性能が向上すること、また結果が独立した推論評価下でも頑健であることを示し、データ駆動型の試験計画に向けた早期のリスク評価を後押しする。




