MultiDx:診断推論に向けた多ソース知識統合フレームワーク

arXiv cs.CL / 2026/4/28

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LLMが診断推論で十分な成果を出せない主因として、ドメイン固有の知識が不足し、内部モデル知識に依存したまま適応力が限定される点を指摘している。
  • 提案手法MultiDxは2段階の診断推論フレームワークで、まずウェブ検索、SOAP形式の症例、臨床症例データベースといった複数の知識源を活用して疑わしい診断と推論パスを生成する。
  • 次に、マッチングや投票、鑑別診断といった手法で多視点のエビデンスを統合し、最終的な診断予測を行う。
  • 著者らは、2つの公開ベンチマークで広範な実験を行い、提案手法の有効性を示したと報告している。

要旨: 診断予測および臨床推論は、ヘルスケア応用において重要なタスクである。大規模言語モデル(LLM)は常識推論において強力な能力を示している一方で、ドメイン知識が限定的であるため、診断推論では依然として困難を抱えている。既存のアプローチはしばしば、内部モデルの知識や静的な知識ベースに依存しており、その結果、知識不足と適応性の制限が生じ、診断推論を実行する能力が妨げられる。さらに、これらの手法は最終予測の正確性にのみ焦点を当てており、標準的な臨床推論の軌跡との整合性を見落としている。そこで本研究では、複数の知識ソースから収集された証拠を分析することで鑑別診断を行う、二段階の診断推論フレームワークであるMultiDxを提案する。具体的には、まずウェブ検索、SOAP形式のケース、臨床ケースデータベースの知識を活用して、疑わしい診断と推論経路を生成する。次に、マッチング、投票、および鑑別診断によって多視点の証拠を統合し、最終予測を生成する。~2つの公開ベンチマークにおける大規模な実験により、本手法の有効性が示されている。