南アフリカの結核ケア向けドメイン特化型大規模言語モデルの開発と予備評価
arXiv cs.LG / 2026/4/23
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本研究は、南アフリカにおける結核(TB)ケアの支援を目的として、患者と医療従事者の負担を軽減するドメイン特化型大規模言語モデル(DS-LLM)を開発した。
- 学習データは、南アフリカのTBガイドライン、選定したTB関連文献、既存の医療ベンチマークデータセットから収集され、医療領域でのLLM開発戦略を文献調査した後に構築された。
- モデルは、BioMistral-7BをQLoRAで微調整し、さらにGraphRAGによるRetrieval-Augmented Generation(RAG)を実装することで構成した。
- 自動評価指標と定量的な評価を用いた予備評価では、DS-LLMは基盤となるBioMistral-7Bや汎用LLMよりも優れており、とりわけTBケアに関する文脈整合性(語彙・意味・知識面)で良好な結果が示された。
- 本成果は、特定の臨床領域や地域ガイダンスに合わせてLLMを調整することで、関連性と整合性を高められる可能性を示す初期の根拠となる。




