多言語医療QAにおける言語横断の証拠(エビデンス)の効果
arXiv cs.CL / 2026/4/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、高資源言語(英語、スペイン語、フランス語、イタリア語)と低資源言語(バスク語、カザフ語)における多言語医療質問応答で、外部エビデンスが性能に与える影響を調査している。
- 3種類の外部エビデンス(専門医療のキュレーション済み知識リポジトリ、Webから取得した内容、LLMのパラメトリックな説明)を、モデル規模の異なる条件下で比較した。
- 結果として、英語ではモデルが大きいほど一貫して性能が高いが、外部エビデンスの最適戦略は言語の資源状況によって変わることが示された。
- 高資源言語では英語のWebから取得したデータが最も有益であり、低資源言語では英語と対象言語の両方を用いた言語横断的な検索が最良で、高資源言語相当の精度につながる。
- 外部知識は常に効果的に性能を押し上げるわけではなく、最適化には「言語資源の種類」と「モデル規模」の両方が重要だと論じている。
- また、PubMedのような専門医療知識ソースは権威性はあるものの、多言語カバレッジが不十分だという制約があることが指摘されている。




