DERM-3R:実世界の臨床現場における皮膚科診断と治療のための、省リソースなマルチモーダル・エージェント・フレームワーク

arXiv cs.AI / 2026/4/14

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • DERM-3Rは、TCM(伝統的中国医学)の皮膚科領域における診断・治療を、限られたデータと計算資源の下で扱うことを目的にした省リソースなマルチモーダルエージェント・フレームワークである。
  • 具体的には、(1) 微細な病変認識、(2) 複数視点での病変表現と専門家レベルの病因モデリング、(3) 症候分化と治療計画のための全体的推論、という3つの意思決定課題に分解して設計されている。
  • DERM-Rec / DERM-Rep / DERM-Reasonの3つの協調エージェントを用い、軽量なマルチモーダルLLMをベースに103件の実臨床のTCM乾癬症例で部分的にファインチューニングした。
  • 自動評価、LLM-as-a-judge、医師評価の複数手法で検証した結果、少ないデータ・パラメータ更新にもかかわらず、大規模な汎用マルチモーダルモデルに匹敵、または上回る性能が報告されている。
  • この研究は、皮膚科のような複雑な臨床・統合医療タスクに対して、スケール依存(ブルートフォース)ではなく、構造化されたドメイン知識とマルチエージェント設計が実用的な代替になり得ることを示唆している。

要旨: 皮膚科疾患は、世界的に大きく、かつ拡大し続ける負担を課しており、何十億人にも影響し、生活の質を大幅に低下させます。現代的な治療法は急性症状を迅速に制御できる一方で、長期的な転帰はしばしば、単一標的のパラダイム、反復を要する治療コース、そして全身性の併存疾患への十分でない注意によって制限されます。伝統医学(TCM)は、証候の弁別と個別化された治療を通じて補完的な全人的アプローチを提供しますが、実践は、標準化されていない知識、マルチモーダル記録の不完全さ、そして専門家による推論のスケーラビリティの低さによって妨げられています。私たちは、限られたデータと計算資源のもとでTCMの皮膚科診断および治療をモデル化するための、資源効率の高いマルチモーダル・エージェント枠組みであるDERM-3Rを提案します。実世界のワークフローに基づき、意思決定を3つの中核的課題として再構成します。すなわち、(1) より細かな病変の認識、(2) 専門家レベルの病因論モデリングを伴う多視点の病変表現、(3) 証候の弁別および治療計画のための全人的推論です。DERM-3Rは、このパイプラインの各構成要素をそれぞれ担当する3つの協調エージェント、DERM-Rec、DERM-Rep、およびDERM-Reasonから構成されます。軽量なマルチモーダルLLM上に構築され、103件の実世界のTCM乾癬症例に対して部分的にファインチューニングを行ったDERM-3Rは、皮膚科の推論タスク全般で高い性能を示します。自動評価指標、LLM-as-a-judge、ならびに医師による評価を用いた検証では、データ量が最小でパラメータ更新もわずかであるにもかかわらず、DERM-3Rが大規模な汎用マルチモーダルモデルに匹敵、あるいは上回ることが示されました。これらの結果は、構造化された領域認識型のマルチエージェント・モデリングが、皮膚科および統合医療における複雑な臨床タスクに対して、ブルートフォースなスケーリングに代わる実用的な選択肢になり得ることを示唆しています。