限られたデータ下での高類似コンテキストにおける全体的認知を分割統治で実現する手法

arXiv cs.CV / 2026/4/22

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、限られた学習データ下でのUltra-FGVC認識において、葉の輪郭のような全体的で識別力のある視覚手がかりを扱うことで、従来の研究の見落としを補うことを目的としています。
  • 複雑な形態に対する全体的手がかりのモデリングを容易にするため、全体的認知を「微細な差異の空間的な関連」に分解し、段階的に全体理解を構築するDivide-and-Conquer Holistic Cognition Network(DHCNet)を提案します。
  • DHCNetは自己シャッフル操作により、小さな局所パッチからより大きな領域へと差異を段階的に解析し、影響を受けない局所領域を用いてシャッフル後のパッチ間の空間的・位相的な関連を推定することで関連付けを助けます。
  • 発見した全体的手がかりについて、学習中にオンラインで洗練(refinement)し、その品質を反復的に高めると同時に、認識モデルの全体像への感度を高める教師信号として活用します。
  • 5つの代表的Ultra-FGVCデータセットでの評価により、DHCNetがデータ制約のある高類似分類で高い性能を達成することが示されています。