SymptomWise:信頼性と効率性を高める決定論的推論レイヤー

arXiv cs.AI / 2026/4/10

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、安全性が極めて重要な文脈におけるAIの症状分析で、信頼性・解釈可能性を高め、幻覚(ハルシネーション)を低減することを目的とした枠組み「SymptomWise」を提案する。
  • SymptomWiseは、キュレーションされた医学知識に加え、有限の仮説空間に対して決定論的かつコデックス駆動の推論モジュールを用いることで、言語理解と診断推論を分離する。
  • 大規模言語モデル(LLM)は、症状の抽出と任意の説明に制約し、実際の診断推論は決定論的に実行することで、追跡可能性を向上させる。
  • 予備的なテストとして、難度の高い小児神経領域の42症例を対象にしたところ、正しい診断がトップ5の鑑別診断内に現れた割合は88%で、臨床医のコンセンサスとの間に大きな一致が見られた。
  • 著者らは、このアプローチは医学の外にも一般化できると主張しており、他のアブダクティブ(仮説形成)推論タスクにおいて、基盤モデルに対する決定論的な構造化/ルーティングのレイヤーとして機能し、不要な計算を減らし得る可能性がある。

要旨: AI駆動の症状分析システムは、信頼性、解釈可能性、そして幻覚(ハルシネーション)に関して継続的な課題に直面している。エンドツーエンドの生成的アプローチは、多くの場合トレーサビリティを欠き、安全性が極めて重要な状況では、裏付けのない、または一貫性のない診断出力を生成しうる。私たちは、言語理解と診断推論を分離する枠組みであるSymptomWiseを提示する。このシステムは、専門家が厳選した医療知識、決定論的なコデックス駆動の推論、そして大規模言語モデルの利用を制約した形で組み合わせる。自由記述入力を検証済みの症状表現へと対応づけ、その後、有限の仮説空間上で動作する決定論的推論モジュールによって評価し、順位付けされた鑑別診断を生成する。言語モデルは、診断推論のためではなく、症状抽出および任意の説明にのみ用いられる。このアーキテクチャにより、トレーサビリティが向上し、裏付けのない結論が減少し、システム構成要素のモジュール別評価が可能になる。専門家が執筆した難度の高い小児神経学症例42件での予備評価では、臨床医のコンセンサスとの間に意味のある一致が見られ、正しい診断が全症例の88%で上位5つの鑑別診断に含まれていた。医学分野を超えて、この枠組みは他のアブダクティブ(仮説形成)推論領域へと一般化でき、基盤モデルに対する決定論的な構造化およびルーティング層として機能しうる。さらに、精度の向上と、境界が定められたタスクにおける不要な計算オーバーヘッドの削減につながる可能性がある。