AI Navigate

眼底画像の解釈可能な基盤モデルに向けて

arXiv cs.CV / 2026/3/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、自己教師付き学習における解釈性の問題に対処するため、眼底画像用の設計上解釈可能な基盤モデルであるDual-IFMを提案する。
  • このモデルは、意思決定プロセスを忠実に反映するクラス証拠マップによる局所的な解釈可能性と、表現空間を可視化する2D投影層を通じたグローバルな解釈可能性を提供します。
  • 本モデルは、さまざまなソースから800,000枚を超えるカラー眼底写真で訓練され、最先端の基盤モデルより最大で16倍のパラメータを持つにもかかわらず、競争力のある性能を達成します。
  • 本研究は、大規模自己教師付き学習と固有の解釈可能性を組み合わせることで、眼底画像に対して頑健で説明可能な表現を生み出し、分布外データにも適用可能だと示唆します。