健康コーチング・エージェントにおける臨床的な不一致の検出:デュアルストリーム・メモリとリコンサイル(照合)アーキテクチャ
arXiv cs.LG / 2026/5/1
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、持続的メモリを用いるLLMの健康コーチング・エージェントにおける安全上の課題として、患者の自己申告は想起バイアスや陳腐化に影響され得る一方、EHRは権威的でもしばしば鮮度が低い点を扱います。
- 患者のナラティブと構造化された臨床記録(FHIR)を厳密に分離し、相違を評価・分類する専用のリコンサイル・エンジンを設けるデュアルストリーム・メモリ・アーキテクチャを提案しています。
- リコンサイル・エンジンは抽出された記憶を患者のFHIRプロファイルと照合し、不一致を種類・重大度・関与するFHIRリソース単位でラベル付けします。
- 26人の患者について、675の縦断的ウェルネス・コーチングセッションで評価した結果、設計された臨床的な不一致の検出率は84.4%で、安全に重大な想起のリコールは86.7%でした。
- 誤差の連鎖(error cascade)として13.6%を定量化し、その主因が後段の分類エラーではなく、非構造の会話からのメモリ抽出過程で臨床的詳細が失われることにあると示しています。




