小型言語モデルを用いた小児病理レポートのための半自動アノテーションワークフロー

arXiv cs.CL / 2026/4/7

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

本研究は、クラウドのLLMサービスに依存せず、プライバシー上の懸念を生じさせることなく、小児の血液・病理（histopathology）EPRテキストから非構造化の臨床データを抽出するという課題に取り組む。
少数ショットの例と、領域に特化したエンティティのガイドラインを用い、臨床医が誘導する質問応答として枠組み化した小型言語モデルを使う、資源効率の高い半自動アノテーションワークフローを提案する。
著者らは、十分に特徴付けられた制約のある領域として小児腎生検レポートを用い、Great Ormond Street Hospitalの2,111件のデータセットから400件のレポートをゴールドスタンダードとして手動アノテーションした。
5つのinstruction-tuned小型言語モデルのうち、Gemma 2 2Bが最良の精度（84.3%）を達成し、いくつかの市販/既製のNLPベースライン（例：spaCy 74.3%）や、さまざまなバイオメディカルQAモデルよりも優れた。
臨床医が作成したエンティティガイドラインと少数ショット・プロンプトにより抽出精度が向上（ガイドライン：+7–19%；少数ショット：+6–38%）し、臨床医の作業時間を最小限にしつつ、CPUのみで効果的に導入できることを可能にした。また、コードは公開されている。