ArchEHR-QA 2026におけるQU-NLP:患者向け臨床QAのためのQwen3-4BをQLoRAの2段階微調整と証拠文アラインメントで実現
arXiv cs.CL / 2026/4/17
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- QU-NLPチームは、ArchEHR-QA 2026に向けて「回答生成」と「証拠文アラインメント」の両方を扱う統合型システムを提案している。
- 回答生成(サブタスク3)では、Qwen3-4Bに対して量子化LoRA(QLoRA)の2段階手法を適用し、まずemrQA-MedSQuADの30,000サンプルで臨床ドメイン適応を行い、その後20個の注釈付き開発ケースでタスク固有の出力スタイルを学習する。
- その結果、サブタスク3の公式test-2026 splitで全体スコア32.87を達成し、BLEU 9.42、ROUGE-L 27.04、BERTScore 43.00などの指標が報告されている。
- 証拠アラインメント(サブタスク4)では、BM25(相対しきい値付き)、TF-IDFコサイン類似度、微調整済みクロスエンコーダの3手法を重み付きアンサンブルにして、100ケースのテストでmicro-F1 67.16を得ている。
- 実験から、20件の注釈付き学習データでは関連文と非関連文を十分に区別できないことが主要なボトルネックであり、今後の最重要方向性としてデータ拡張が示唆されている。




