AI Navigate

街路シーンの分布外物体検出を Synthetic Outlier Exposure と転移学習で実現

arXiv cs.CV / 2026/3/18

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • SynOE-ODは、1つの検出器で分布内オブジェクトと分布外オブジェクトの両方を検出できるようにし、街路シーン検出のためにOODとIDを統一的な枠組みとして扱います。
  • 強力な生成モデル(例:Stable Diffusion)とオープンボキャブラリ検出器を活用して、学習用の意味のある外れ値を作成することで、合成外れ値曝露を使用します。
  • このアプローチは GroundingDINO のような OVOD を用いて、IDタスクの性能を維持しつつ OOD検出の頑健性を高めるために転移学習を適用します。
  • 確立された OOD物体検出ベンチマークにおいて最先端の平均適合率を達成し、従来の OVOD が街路シーンでゼロショット性能に限界を示していた領域で OOD検出の改善を強調します。

Abstract

要旨: Out-of-distribution (OOD) オブジェクト検出は、重要であると同時に十分には検討されていない課題です。信頼性の高いオブジェクト検出器は、OODオブジェクトを局在化し、正しくOODとして分類することで対応できるべきです。しかし、このような非典型的なオブジェクトが検出器に完全に見逃され、背景として誤って扱われるという重大な問題が生じます。既存のOOD検出手法は、複雑なアーキテクチャや補助ブランチに依存することが多く、ID(in-distribution)とOODを統一的に扱う枠組みを通常は提供していません。本研究では、IDオブジェクトと併せて、そうした黙って見落とされがちなOODオブジェクトを検出できる単一の検出器を実現することで、これらの制限に対処します。私たちは \textbf{SynOE-OD}、\textbf{Syn}thetic \textbf{O}utlier-\textbf{E}xposure-based \textbf{O}bject \textbf{D}etection framework を提示します。これは、Stable Diffusion のような強力な生成モデルと Open-Vocabulary Object Detectors (OVODs) を活用して、訓練時の外れ値として機能する、意味的に有意義なオブジェクトレベルデータを生成します。生成されたデータは転移学習に用いられ、強力なIDタスクの性能を確立し、OODオブジェクト検出の頑健性を検出モデルに補完します。我々のアプローチは、GroundingDINO のような OVOD が、街路シーンにおける OOD オブジェクト検出でゼロショット性能が限定的である、確立済みの OOD オブジェクト検出ベンチマークにおいて、最先端の平均適合度を達成します。)