海洋生物分類のための凍結ビジュアルトランスフォーマにおける回路複製による推論パス最適化

arXiv cs.CV / 2026/4/7

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、自主教師ありの視覚基盤モデル（例：DINOv3）の凍結埋め込みを用い、微調整や重み変更を一切行わずに、ラベル効率の高い海洋生物分類を改善することを探求する。
それは、LLM（大規模言語モデル）からの推論時手法である「回路複製（Circuit Duplication）」を適用し、順伝播中に選択した範囲のトランスフォーマ層を複製して表現を強化する。
クラス不均衡のあるAQUA20ベンチマークにおいて、グローバルおよびクラス固有の回路選択の両方が、標準的な1回の凍結順伝播よりも優れており、クラス固有の選択が最良の性能を示す。
最大のラベル予算では、クラス固有の選択により macro F1=0.875 を達成し、完全教師ありのConvNeXtベンチマーク（0.889）にほぼ匹敵し、勾配ベースの学習なしでギャップをほぼ埋める。
結果は、クラス依存の大きな向上（約75%のクラスがクラス固有の回路の恩恵を受ける）を示し、本研究は回路複製のコンピュータビジョンへの初めての適用であると主張する。

AI Business

AI-SCHOLAR

note

日経XTECH

日経XTECH