DeCo-DETR:効率的なオープンボキャブラリ物体検出のための、デカップルド認知DETR
arXiv cs.CV / 2026/4/6
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- DeCo-DETRは、既存のOVOD手法の実運用上の制約に焦点を当てた、オープンボキャブラリ物体検出のための新しいビジョン中心のフレームワークとして提案される。
- この手法は、事後の推論時に高コストなテキストエンコーディングを行わず、事前学習済みLVLMからの領域レベル記述を用いて、CLIPで整合させることで再利用可能な意味を持つ階層的セマンティック・プロトタイプ空間をオフラインで構築する。
- さらに、意味推論とローカライゼーションを分離することで学習ダイナミクスを改善し、整合と検出を並列の最適化ストリームとして実行することで、典型的な「精度–汎化性能」のトレードオフを低減する。
- 標準的なOVODベンチマークでの実験では、競争力のあるゼロショット性能に加えて、推論効率が大幅に向上していることが示され、実システムに向けたスケーラビリティの高さが示唆される。
