AI Navigate

LLM-MINE: 臨床ノートからアルツハイマー病および関連認知症の表現型を大規模言語モデルを用いてマイニングする手法

arXiv cs.AI / 2026/3/17

📰 ニュースSignals & Early TrendsModels & Research

要点

  • LLM-MINE は、電子カルテの非構造化臨床ノートから ADRD 表現型を抽出するフレームワークとして紹介される。
  • 本手法は、専門家定義の2つの表現型リストと few-shot prompting(少数ショット・プロンプティング)を用いて、表現型の抽出とクラスタリング性能を向上させる。
  • 本手法は生物医学NERおよび辞書ベースの基準を上回り、ARI=0.290、NMI=0.232を達成した。
  • 結果は、記憶障害がコホート間で最も強い識別因子であることを示し、抽出された表現型を用いた教師なしの疾患ステージングを支持し、潜在的な臨床的有用性を示唆する。

要旨:アルツハイマー病および関連認知症(ADRD)表現型を電子カルテ(EHR)から正確に抽出することは、早期段階の検出と病期診断にとって重要です。しかし、この情報は通常、表形式データよりも非構造化のテキストデータに埋め込まれており、正確に抽出するのが難しいです。そこで本研究では、臨床ノートからADRD表現型を自動抽出するための大規模言語モデル(LLM)ベースの表現型マイニングフレームワーク「LLM-MINE」を提案します。二つの専門家定義の表現型リストを用いて、抽出された表現型を、コホート間の統計的有意性と教師なし病期診断への有用性の観点から評価します。カイ二乗分析により、コホート間で表現型の差が統計的に有意であることが確認され、記憶障害が最も強い識別因子となっています。結合した表現型リストを用いたFew-shot プロンプトにより、最良のクラスタリング性能(ARI=0.290、NMI=0.232)を達成し、生物医学的NERおよび辞書ベースのベースラインを大幅に上回っています。我々の結果は、LLMベースの表現型抽出が、非構造化ノートから臨床的に意味のあるADRD信号を発見する有望なツールであることを示しています。