推論能力のあるLLMを用いて診療記録からSDOHイベントを抽出する

arXiv cs.CL / 2026/4/16

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • arXivの研究では、EHR内の非構造化された臨床記録から、推論能力のあるLLMを用いて構造化された健康の社会的決定要因(SDOH)イベントを抽出し、下流のケア運用ワークフローで機械可読にすることを提案している。
  • ガイドラインに整合した簡潔なプロンプト、厳選された例によるfew-shot学習、頑健性のための自己一貫性メカニズム、そして事後処理による品質管理という、4モジュールのプロンプトエンジニアリング手法を提示している。
  • この手法はmicro-F1スコア0.866を報告しており、先行する有力モデルと競合する性能であることを示すと同時に、高度なBERTベースのパイプラインに比べて実装がより単純で計算負荷が低い点を強調している。
  • 結果は、推論LLMがSDOHの識別を大規模に実運用できる可能性を示しており、臨床現場における体系的なSDOH管理の改善につながるかもしれない。

Abstract

健康の社会的決定要因(SDOH)とは、個人がどのように生活し、働き、そして年齢を重ねていくかに影響を与える環境的・行動的・社会的な状況を指します。SDOHは個人の健康アウトカムに大きな影響を及ぼし、その体系的な特定と管理は、患者ケアの大幅な改善につながり得ます。しかしながら、SDOH情報は主として、電子健康記録(EHR)内の非構造化された診療記録ノートに記録されており、機械可読な実体として直接利用することが困難です。この課題に対処するため、研究者らは、事前学習済みのBERTベース・モデルを用いた自然言語処理(NLP)手法を採用し、有望な性能を示してきましたが、実装の高度な工夫と大規模な計算資源を要します。本研究では、高度な推論能力を備えたLLMを用いて、構造化されたSDOHイベントを抽出するためのプロンプトエンジニアリング戦略を検討しました。提案手法は4つのモジュールで構成されます:1)確立されたガイドラインを統合した、簡潔で説明的なプロンプトの開発、2)慎重に厳選した例を用いた少数ショット学習、3)頑健な出力を確保するための自己一貫性メカニズムの利用、4)品質管理のための事後処理。提案手法は0.866のmicro-F1スコアを達成し、主要モデルに対して競争力のある性能を示しました。その結果、推論能力を備えたLLMはSDOHイベント抽出に有効な解決策であり、実装のシンプルさと高い性能の両方を提供することが示されました。