大規模言語モデルを用いたフィンランドの電子健康記録からの臨床情報検索の自動化
arXiv cs.CL / 2026/3/30
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 論文は、フィンランドのEHRテキストからデータを外部に転送せずに、臨床医の質問に直接答えるローカル展開可能なClinical Contextual Question Answering(CCQA)フレームワークを提案する。
- 183人の患者から得た、専門家が注釈付けした質問–回答ペア1,664件からなるオフライン・データセットを用いて、複数のオープンソースLLM(4B〜70Bパラメータ)をベンチマークし、テキストの大半がフィンランド語である。
- Llama-3.1-70Bは自由形式テキストにおける高い性能を示し(正確性95.3%、意味的に同等な質問バリアント間での一貫性97.3%)、Qwen3-30B-A3B-2507も同等の結果を示した。
- 4ビットおよび8ビットへの量子化により、GPUメモリ要件を削減しつつ、予測性能を大きく損なわずに維持でき、オフライン環境での展開可能性が向上した。
- 臨床評価では、出力の2.9%に臨床的に重大な誤りがあることが示され、意味的に同等な質問でも回答が食い違う可能性があることが明らかになった。これにより、検証と人による監督の必要性が強調される。
