基礎を超えて：大規模言語モデルを活用したきめ細かな医療エンティティ認識

arXiv cs.AI / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、粗いエンティティ種別ではなく、より細かなMedical Entity Recognition（MER）に焦点を当てることで、非構造化の医療テキストから臨床的に重要な情報を抽出する課題に取り組んでいる。
オープンソースのLLaMA3モデルを18の詳細な臨床エンティティカテゴリにわたって評価し、ゼロショット・少数ショット・LoRAによるファインチューニングの3手法を比較した。
少数ショット学習の性能向上のために、BioBERTのトークン/文レベル埋め込み類似度に基づく2種類の例選択手法を提案している。
すべての手法を同一のLLaMA3バックボーンに適用することで、学習設定間の比較の公平性を高めている。
結果として、ファインチューニングしたLLaMA3がゼロショットおよび少数ショットを大幅に上回り、きめ細かな医療エンティティ抽出でF1スコア81.24%を達成した。