MedSynapse-V:潜在メモリの進化で視覚認識と臨床的直観をつなぐ
arXiv cs.AI / 2026/4/30
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、医療ビジョン言語モデル(VLM)が離散トークン化によって認知的なズレを起こし、量子化損失や長距離情報の散逸、ケース適応的な臨床的知見の欠落が生じると主張している。
- 提案手法MedSynapse-Vは、モデル内部の隠れ表現の中で「診断の潜在メモリ」を進化させ、画像解釈時に臨床家が暗黙に専門知識を呼び起こすプロセスをより模倣することを目指している。
- Meta Query for Prior Memorizationにより解剖学的な事前知識から構造化された事前を取得して凝縮した暗黙メモリを生成し、その後、CCR(Causal Counterfactual Refinement)で強化学習と反実仮想報酬(領域レベルの特徴マスキング)を用いて冗長なメモリを削減し、診断ロジックに整合させる。
- 最終的にIMT(Intrinsic Memory Transition)では、デュアルブランチの仕組みにより、全ボキャブラリのダイバージェンス整合を通じて教師側の診断パターンを学生側の内部へ内在化する。
- 複数データセットでの実験では、外部の専門知識を内部パラメータへ移すことで、既存の最先端手法(連鎖思考ベースを含む)よりも診断精度が大きく向上すると報告されている。
