物体検出におけるタスク駆動型機能の先へ
arXiv cs.CV / 2026/4/7
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、近年の物体検出器におけるタスク最適化された特徴が、注釈の真の幾何や構造を捉え損ねる「ショートカット相関」を符号化し得ると主張する。
- 注釈に導かれた特徴拡張の枠組みを提案し、注釈に導かれた潜在空間から密な空間特徴グリッドを構築し、それらを検出バックボーン内の特徴ピラミッドと融合する。
- 領域提案(region proposal)および検出ヘッドに幾何情報に配慮した情報を注入することで、基盤となる注釈構造により適合する表現の生成を目指す。
- 野生動物およびリモートセンシングのデータセットで、分類・位置特定・データ効率を、異なる教師あり設定(supervision regimes)にわたって評価する。
- 結果は、対象への注目の改善、背景への感度の低下、タスク変更時や教師が疎な場合におけるより強い汎化を示している。




