AI Navigate

EReCu: 擬似ラベル進化の融合とマルチキュー学習による教師なし隠蔽検出の洗練

arXiv cs.CV / 2026/3/13

📰 ニュースModels & Research

要点

  • 本論文は、擬似ラベルの信頼性と特徴の忠実性を向上させる統一的な教師なし隠蔽オブジェクト検出フレームワーク EReCu を提案する。
  • 低レベルのテクスチャ手掛かりと中レベルの意味情報を組み合わせ、マスクをネイティブな物体情報とより適切に整合させる Multi-Cue Native Perception モジュールを提案する。
  • 擬似ラベル進化フュージョンを提示し、教師-学生間の洗練を可能にするとともに、効率的な意味的ノイズ除去のために深さ方向分離畳み込みを用いる。
  • スペクトルテンソルアテンションフュージョンは、複数層のアテンションマップにわたるコンパクトなスペクトル集約を通じて、意味情報と構造情報のバランスを取るために用いられる。
  • 局所的な擬似ラベルの洗練は、アテンションの多様性を活用して微細なテクスチャの回復と境界忠実性の向上を図り、UCOD ベンチマークで最先端の性能を達成し、強力な一般化を示す。
要旨: 要旨: 教師なしの隠蔽物体検出(UCOD)は、対象物と周囲の高い内在的な類似性および細かな質感学習を妨げるノイズの多い擬似ラベルへの依存のため、依然として困難な課題である。既存の改良戦略はラベルノイズの軽減を目指すが、内在的知覚手掛かりを見落としがちで、境界のオーバーフローと構造的曖昧さを招く。これに対して、擬似ラベルの指導なしでの学習は特徴を粗く、細部の損失が大きい。これらの問題に対処するため、我々は擬似ラベルの信頼性と特徴の忠実性の双方を高める統一的な UCOD フレームワークを提案する。我々のアプローチは、低レベルのテクスチャ手掛かりと中レベルの意味情報を統合して内在的視覚先验を抽出し、マスクとネイティブな物体情報との正確な整合を可能にする Multi-Cue Native Perception モジュールを導入する。さらに、深さ方向分離畳み込みを活用して効率的な意味ノイズ除去を行い、擬似ラベル進化フュージョンを用いて教師-学生の相互作用を通じてラベルを賢く洗練する。また、スペクトルテンソルアテンションフュージョンを組み込み、複数層のアテンションマップにまたがるコンパクトなスペクトル集約を通じて意味情報と構造情報のバランスを効果的に取る。最後に、局所的擬似ラベルの洗練はアテンションの多様性を活用して局所的な詳細を回復し、境界忠実性を高める。複数の UCOD データセットにおける広範な実験は、我々の手法が最先端の性能を達成し、優れた細部知覚、堅牢な境界整合性、および複雑な隠蔽シナリオ下での強い一般化を特徴とすることを示している。