MedConceal:部分観測下における臨床の隠れた懸念推論のためのベンチマーク
arXiv cs.CL / 2026/4/13
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- MedConcealは、患者の隠れた恐れや障壁が適切に聞き出されるまで開示されないという「部分観測下」で推論する必要がある臨床対話システムを評価するための新しいベンチマークとして提案される。
- このベンチマークでは、潜在的な懸念を隠したまま進行するインタラクティブな患者シミュレータを用い、臨床家がそれらを明らかにし対処するかどうかを追跡するとともに、最終的なタスク結果に加えて、プロセスに配慮したターン単位のコミュニケーションのシグナルを評価する。
- 300件の厳選ケース(臨床家が回答したオンライン健康相談から構築)と、600件の臨床家–LLMの相互作用ログを含み、隠れた懸念は既存文献から導出され、専門家が開発した分類法(タクソノミー)で整理されている。
- 2つの主要能力—確認(懸念を複数ターンにわたって顕在化させること)と介入(懸念に対処し、目標とするケア計画へ導くこと)—に関する実験では、指標の全体において単一のシステムが常に優位であることは見られない。
- 本研究では、最前線モデルが確認の一部の指標で最良の性能を示す一方、介入の成功では人間の臨床家が最も強いことが報告されており、医療対話における「隠れた懸念推論」は未解決の課題として浮き彫りになっている。

