患者教育をマルチターンかつマルチモーダルな対話として再考する

arXiv cs.AI / 2026/4/17

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

共有:

要点

本論文は、放射線領域の患者教育は、典型的な静的な医療マルチモーダル課題よりも難しく、エビデンスに基づいて説明し、患者が注目すべき箇所を示し、混乱や不安に対応する必要があると主張している。
提案されるMedImageEduは、放射線レポート本文と症例画像を用い、隠れた患者プロファイル（教育レベルやヘルス・リテラシー等）を条件にしたDoctorAgent–PatientAgentのマルチターン対話を扱う新しいベンチマークである。
医師エージェントは、必要に応じて報告書・症例画像・現在の質問に根拠付けされた描画指示を出し、描画ツールが生成した画像を受け取った後、画像付きの最終回答として平易な説明を返す。
開発・公開の複数ビジョン・ランゲージ・モデルエージェントで評価した結果、言語は流暢でも視覚的根拠が伴わないこと、安全性が疾患カテゴリ全体で最も弱いこと、そして感情的に緊張したやり取りが低教育・低ヘルス・リテラシーの場合より難しいことの3点が一貫して見られた。
MedImageEduは、マルチモーダルエージェントが「文章だけの回答」ではなく「エビデンスに基づいて教える」能力を検証するための統制されたテストベッドとして位置づけられている。