TrajOnco:多がん早期検出のための、縦断EHRに対する時間的推論を行うマルチエージェントフレームワーク

arXiv cs.AI / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • TrajOncoは、縦断的なEHRデータに対する時間的推論を支援する、訓練不要のマルチエージェントLLMフレームワークとして導入され、多がんの早期検出を目的とする。
  • エージェントの連鎖(chain-of-agents)アーキテクチャは長期記憶を用い、時系列の臨床イベントから患者レベルの要約、エビデンスに紐づけられた根拠(ラショネール)、および1年予測のがんリスクスコアを生成する。
  • 個人情報を除去したTruveta EHRを15のがん種に対してゼロショット評価したところ、TrajOncoはAUROCが0.64〜0.80を達成し、肺がんベンチマークでは教師あり機械学習と競合する性能を示した。
  • 単一エージェントのLLMと比較して、TrajOncoは時間的推論が改善されており、GPT-4.1-miniのような小型モデルであってもマルチエージェントアプローチは有効性を維持する。
  • 人手による評価により、TrajOncoの出力の忠実性が検証されており、集約された解釈可能な根拠(ラショネール)によって、臨床知識と整合する集団レベルのリスクパターンを明らかにできる。

Abstract

長期にわたる電子健康記録(EHR)からのがんリスクの正確な推定は、より早期の検出とケアの改善を支える可能性がありますが、このような複雑な患者の軌跡をモデリングすることは依然として困難です。私たちは、スケーラブルな多がんの早期検出のために設計された、学習不要(training-free)のマルチエージェント大規模言語モデル(LLM)フレームワーク「TrajOnco」を提案します。長期メモリを備えたチェーン・オブ・エージェント構成を用いて、TrajOncoは一連の臨床イベントに対して時間的推論を行い、患者単位の要約、エビデンスに紐づいた根拠(ラショナーレ)、および予測リスクスコアを生成します。私たちは、対応づけられた症例対照コホートを用いて、15種類のがんにわたる匿名化済みTruveta EHRデータ上でTrajOncoを評価し、1年時点でのがん診断リスクを予測しました。ゼロショット評価において、TrajOncoはAUROCを0.64〜0.80の範囲で達成し、肺がんのベンチマークでは教師あり機械学習と同等の性能を示しつつ、単一エージェントのLLMよりも優れた時間的推論を示しました。さらにマルチエージェント設計により、GPT-4.1-miniのような小容量モデルでも効果的な時間的推論が可能になりました。TrajOncoの出力の忠実性(fidelity)は人手による評価によって検証されました。加えて、TrajOncoの解釈可能な推論出力は集約して、確立された臨床知識と整合する集団レベルのリスクパターンを明らかにできます。これらの結果は、長期EHRに対して解釈可能な時間的推論を実行するうえでのマルチエージェントLLMの可能性を示しており、スケーラブルな多がんの早期検出と、臨床的洞察の生成の両方を前進させるものです。