MedAidDialog:アクセシブルな医療のための多言語・マルチターン医療対話データセット
arXiv cs.CL / 2026/3/26
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- MedAidDialogは、従来の単一ターンまたはテンプレートベースのリソースと比べて、より現実的な医師—患者の診察を模倣することを目的とした、多言語・マルチターンの医療対話データセットとして紹介される。
- このデータセットは大規模言語モデルを用いて合成生成され、MDDialを拡張したうえで、7つの言語(英語、ヒンディー語、テルグ語、タミル語、ベンガル語、マラーティー語、アラビア語)にまたがる並列コーパスとして拡張される。
- 付随する会話型医療モデルとしてMedAidLMが提示され、量子化された小規模言語モデルに対するパラメータ効率の高いファインチューニングによって学習され、高度な計算基盤を必要とせずに導入できることを目指す。
- フレームワークは、年齢、性別、アレルギーなどの患者事前コンテキストを任意で与えることをサポートし、症状の聴取と、それに基づく診断推奨を個別化する。
- 実験では、マルチターンでの症状聴取および診断推奨生成が有効であることが報告され、医療専門家による評価を用いて診察のもっともらしさと整合性を判定する。