TrialsBankに基づく臨床試験の運用成功を予測するための潜在リスクを考慮した機械学習アプローチ

arXiv cs.AI / 2026/4/1

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、臨床試験が開始前に運用面で成功するかどうかを、見通し（prospectively）として予測するための階層的な潜在リスクを考慮した機械学習フレームワークを提案する。
運用成功は、データベースロック時点までに、計画された期間、募集目標、プロトコル仕様のもとで試験を開始・実施・完了することとして定義される。
本手法は段階的アプローチを採用する。まず、設計時点で利用可能な180以上の「薬剤レベルおよび試験レベル」の特徴量から、中間的な潜在の運用リスク要因を予測し、その潜在リスクを用いて運用成功確率を推定する。
著者らは、TrialsBankの厳選サブセット（13,700件の試験）を用いて、XGBoost、CatBoost、Explainable Boosting Machinesをベンチマークし、フェーズI〜IIIにわたって強いアウト・オブ・サンプル性能を報告する（F1スコアは約0.91〜0.93）。
潜在リスクのドライバーを組み込むことで運用上の失敗の弁別性能が向上すること、また結果が独立した推論評価下でも頑健であることを示し、データ駆動型の試験計画に向けた早期のリスク評価を後押しする。

Abstract

臨床試験は、高コスト、長期にわたるタイムライン、そして重大な運用上のリスクによって特徴づけられる一方で、開始前に試験の成功を予測するための信頼できる前向き手法は依然として限られています。既存の人工知能（AI）アプローチは、多くの場合、単独の指標、あるいは特定の開発段階に焦点を当てており、さらに試験デザイン段階では利用できない変数に依存することが多いため、現実世界での適用性が制限されています。本研究では、Sorintellis によって開発された、AI向けに整備されたプロプライエタリ・データベースである TrialsBank の厳選されたサブセット（13,700件の試験）を用いて、臨床試験の運用上の成功を前向きに予測するための階層的潜在リスク認識型機械学習フレームワークを提示します。運用上の成功は、データベースロックまでに、計画されたタイムライン、募集目標、プロトコルの仕様に従って、臨床試験を開始し、実施し、完了できることと定義しました。このアプローチでは、運用上の成功の予測を2つのモデリング段階に分解します。第一に、試験開始前に利用可能な180以上の薬剤レベルおよび試験レベルの特徴量を用いて、中間的な潜在運用リスク要因を予測します。次に、これらの予測された潜在リスクを下流のモデルに統合し、運用上の成功確率を推定します。情報漏えいを防ぐために段階的なデータ分割戦略を採用し、モデルのベンチマークには XGBoost、CatBoost、Explainable Boosting Machines を用いました。フェーズI〜IIIにわたり、このフレームワークは強い外部データでの性能を達成し、それぞれ F1スコアは 0.93、0.92、0.91 です。潜在リスクのドライバーを取り入れることで運用上の失敗の識別が改善され、独立した推論評価下でも性能は堅牢に維持されます。これらの結果は、潜在リスク認識型AIフレームワークにより、臨床試験の運用上の成功を前向きに予測できることを示しており、早期のリスク評価を可能にし、データ駆動型の臨床開発における意思決定を支援します。