不確実性下で主導的に相談する実世界のドクターエージェント:マルチエージェント強化学習によるアプローチ
arXiv cs.CL / 2026/5/1
📰 ニュースModels & Research
要点
- 本研究は、現行のLLMベースの診療相談システムが、単発の入力で全症状を一度に求めることや、静的な教師あり学習に縛られた対話モデルが能動的な多ターン推論で理解を構築できないことから、臨床相談でうまく機能しにくいと主張している。
- その課題に対し、DoctorAgent-RLという強化学習ベースのマルチエージェント協調フレームワークを提案し、Qwen2.5-7B-Instructをこの枠組みで学習させ、医師エージェントに「最適な質問手法」を獲得させる。
- 相談を不確実性下の動的な意思決定として捉え、戦略的な質問によって多ターン対話の中で重要な患者情報が段階的に明らかになるよう導く。
- リアル寄りの学習を支えるため、対話的で動的な訓練を目的にした新しい英語の多ターン医療相談データセットMTMedDialogを新たに構築している。
- ブラインド評価や実患者を用いた試験などを含む検証の結果、DoctorAgent-RLは先端モデルを上回り、完全一致の診断率70%を達成したと報告されており、初期スクリーニングを担って医師不足や誤診リスク、医療資源の負荷軽減に寄与する可能性が示されている。




