大規模言語モデルを用いた臨床ナラティブにおけるHIV関連のスティグマの検出
arXiv cs.CL / 2026/4/10
📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research
要点
- 本研究は、臨床記録からスティグマ情報を抽出するための既製ツールが不足していることに対処し、臨床ナラティブにおけるHIV関連スティグマを検出するLLMベースのアプローチを提示する。
- UF Healthの臨床ノート(2012〜2022)を用い、スティグマの4つの下位尺度(公的態度への懸念、開示に関する懸念、否定的な自己イメージ、パーソナライズされたスティグマ)に基づいて1,332件の注釈付き文からなるラベル付きデータセットを構築する。
- エンコーダ型および生成型のLLMを、ゼロショットおよび少数ショットのプロンプトでベンチマークし、GatorTron-largeが総合最高性能(Micro-F1 = 0.62)を達成する。
- 少数ショット・プロンプトは生成モデルを大きく改善させる。5-shotのGPT-OSS-20B(Micro-F1 = 0.57)およびLLaMA-8B(Micro-F1 = 0.59)は競争力のある性能を示すが、ゼロショットの生成推論では顕著な失敗率(最大32%)が見られる。
- 予測性能は下位尺度によって異なり、否定的な自己イメージが最も検出しやすく、パーソナライズされたスティグマが最も難しいままであることが示され、今後のモデル改良のための領域を明らかにする。




