MedOpenClaw: 手続き可能(監査可能)な医用画像エージェントが未キュレーションの完全検査(full studies)に対して推論する
arXiv cs.CV / 2026/3/27
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、医療分野の視覚言語モデルの現在の評価が、臨床実務を過度に単純化していると主張している。具体的には、キュレーションされた2D画像を用いるのではなく、エージェントにフルの3D・複数シーケンス/複数モダリティの検査を探索させる必要があるという点を指摘する。
- MEDOPENCLAWと呼ばれる、VLMベースのエージェントが3D Slicerのような標準的な医療ビューア/ツール内で動的に動作できる、監査可能な実行基盤を提案する。
- MEDFLOWBENCHを導入し、複数シーケンスの脳MRIおよび肺CT/PETを対象とした「完全検査」ベンチマークを提示する。ここでは、ビューアのみ・ツール使用・オープン手法という設定間でエージェント的(agentic)性能を比較する。
- 初期結果では、性能に関する逆説が示される。すなわち、強力なLLM/VLMはビューアのみのモードでは基本的な検査ナビゲーションを完了できる一方、専門的な支援ツールへのアクセスを与えると性能が低下する。その原因は、精密な空間的グラウンディングの不足にあるとされる。
- 著者らは、MEDOPENCLAWおよびMEDFLOWBENCHを、監査可能でインタラクティブな医用画像エージェントを構築・評価するための、再現可能な基盤として位置づけている。



