「AI」は医師になれるのか？共感性・読みやすさ・臨床LLMのアラインメントに関する研究

arXiv cs.CL / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本研究は、一般用途および医療領域特化のLLMについて、構造化された医学的説明と実際の医師—患者間のやり取りの両方で、意味の忠実度・読みやすさ・情動面の共鳴を指標化して臨床コミュニケーション基準との整合性を評価した。
ベースラインのモデルは医師よりも情動の極端さが強まりやすく、同時に言語の複雑さも上がる傾向があり、大規模なモデルでは医師文の応答よりFKGLが大きくなる例が示された。
共感を促すプロンプトは強い否定的表現を減らし、読みやすさの複雑さを下げられるが、医師の内容への意味的な忠実度を有意に高めることはできなかった。
コラボレーション型の書き換えが総合的な整合性で最も効果的であり、リフレーズ構成は医師回答との意味的類似度が最も高いだけでなく、読みやすさと感情の極端さも一貫して改善した。
ステークホルダー双方の評価では、どのモデルも認識論的（epistemic）基準で医師を上回らず、患者は明確さと感情トーンの点で書き換え版を一貫して好むことが示され、LLMは専門性の代替ではなく臨床コミュニケーションの補助として機能するのが最も適していることを示唆している。