MedRoute:マルチエージェント医療診断における強化学習ベースの動的スペシャリスト・ルーティング

arXiv cs.LG / 2026/4/9

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • MedRoute は、各エージェントを「専門医」と見立てた動的なマルチエージェント LMM 診断フレームワークで、実臨床の“症状に応じた専門家の切り替え”を模倣することを目指しています。
  • 従来のように専門家を固定・事前定義するのではなく、General Practitioner に RL(強化学習)で訓練したルータを組み込み、状況の変化に応じて適切な専門家を動的に選択します。
  • 最終判断は Moderator が統合して出力し、各専門家の見解を協調的に扱える設計になっています。
  • テキスト/画像の医療データセットで広範に評価され、診断精度で既存の最先端ベースラインを上回ったと報告されています。
  • 研究の再現性のため、コードとモデルが GitHub(UCF-CRCV/MedRoute)で公開されています。

要旨: 大規模マルチモーダルモデル(LMM)を用いた医療診断は、精密な診断を提供できる能力により、近年ますます注目を集めています。これらのモデルは一般に、医療上の質問と視覚入力を組み合わせて、診断や治療方針を生成します。しかし、これらはしばしば過度に一般的であり、現実の医療における多様な医療状況には適していません。臨床現場では、診断は複数の専門医によって行われ、それぞれが領域固有の専門知識を提供します。このプロセスを模倣するための解決策として、各エージェントが医療の専門家として機能する動的なマルチエージェントLMMフレームワークを導入することが考えられます。現在、この新興分野における既存手法は、典型的には、さまざまな専門家の静的または事前に定義された選択に依存しており、変化する実運用の状況に適応できません。本論文では、専門家である複数のLMMエージェントが協調するコラボレーティブなシステムから成る、柔軟で動的なマルチエージェントフレームワークであるMedRouteを提案します。さらに、動的な専門家選択のためにRLで訓練したルータを備えた一般診療医(General Practitioner)を追加し、最終決定を生成するモデレーターも導入します。これにより、私たちのフレームワークは実際の臨床ワークフローをより忠実に反映します。テキストおよび画像ベースの医療データセットに対する大規模な評価の結果、診断精度が向上し、最先端のベースラインを上回ることが示されました。本研究は、今後の研究のための強固な基盤を築きます。コードおよびモデルは https://github.com/UCF-CRCV/MedRoute/ で公開しています。