NoOVD: オープン・ボキャブラリ型物体検出のための新規カテゴリ発見と埋め込み

arXiv cs.CV / 2026/3/24

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、オープン・ボキャブラリ型物体検出における重要な学習–テスト不一致を特定している。具体的には、ラベル付けされていない新規カテゴリの物体が繰り返し背景として扱われ、推論時には早期に除外されるため、リコールが低下する。
  • 追加データを必要とせずに検出器が新規カテゴリを発見できるようにする訓練フレームワークとして、NoOVDを提案する。本フレームワークは凍結した視覚言語モデル(VLM)からの自己蒸留を用いる。
  • 提案コンポーネント(K-FPN)は、VLMの知識を新規カテゴリ発見を導くために転送し、新規物体を背景へ無理に整合させてしまうことを回避する。
  • 推論時には、提案手法にR-RPNを追加し、提案(proposal)の信頼度スコアを調整して新規カテゴリの物体のリコールを改善する。
  • OV-LVIS、OV-COCO、Objects365にまたがる実験により、複数の評価指標で一貫して性能向上が確認される。