診断、計画の失敗、そして推論:臨床試験データに対するハイブリッド照会のための計画
arXiv cs.CL / 2026/4/29
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- 本論文は、回答が表のセルに直接格納されず、正規化・分類・抽出・軽量な領域推論などの意味理解を通じて導く必要がある、臨床試験テーブル推論を扱う。
- 暗黙の計画前提に基づくために多くのLLM手法が「推論の不良(bad reasoning)」に陥りやすいという観察を動機としており、療法の種類、追加されたエージェント、エンドポイントの役割、追跡状況といった暗黙属性の復元が部分的にしか観測されない状況を対象にする。
- 著者らはSCOPE(Structured Clinical hybrid Planning for Evidence retrieval in clinical trials)を提案し、複数LLMによる計画を行って行選択・構造化計画・実行にタスクを分解し、回答生成前にソース項目、推論ルール、出力制約を明示して曖昧さを減らす。
- 1,500件のオンコロジー領域のハイブリッド推論質問で評価した結果、SCOPEはゼロショット、少数ショット、Chain-of-Thought、TableGPT2、Blend-SQL、EHRAgentなどに比べ推論ベースの質問で精度を向上させ、重いエージェント型ベースラインよりも精度と効率のバランスが良いことを示す。
- 本研究は「臨床試験の推論」を独自のテーブル理解問題として位置づけ、ハイブリッドなプランナー分解がエビデンス検索タスクに有効であることを強調している。



