海洋生物分類のための凍結ビジュアルトランスフォーマにおける回路複製による推論パス最適化

arXiv cs.CV / 2026/4/7

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、自主教師ありの視覚基盤モデル(例:DINOv3)の凍結埋め込みを用い、微調整や重み変更を一切行わずに、ラベル効率の高い海洋生物分類を改善することを探求する。
  • それは、LLM(大規模言語モデル)からの推論時手法である「回路複製(Circuit Duplication)」を適用し、順伝播中に選択した範囲のトランスフォーマ層を複製して表現を強化する。
  • クラス不均衡のあるAQUA20ベンチマークにおいて、グローバルおよびクラス固有の回路選択の両方が、標準的な1回の凍結順伝播よりも優れており、クラス固有の選択が最良の性能を示す。
  • 最大のラベル予算では、クラス固有の選択により macro F1=0.875 を達成し、完全教師ありのConvNeXtベンチマーク(0.889)にほぼ匹敵し、勾配ベースの学習なしでギャップをほぼ埋める。
  • 結果は、クラス依存の大きな向上(約75%のクラスがクラス固有の回路の恩恵を受ける)を示し、本研究は回路複製のコンピュータビジョンへの初めての適用であると主張する。