一般化の精査:クロスドメイン検出は進展するが、落とし穴と根強い課題は残る

arXiv cs.CV / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • この記事ではクロスドメイン物体検出(CDOD)を概観し、あるドメインで学習したモデルが、未見のターゲットドメインではなぜ急激に性能低下するのかを、センシング条件・環境・データ分布の変化に焦点を当てて説明する。
  • ドメインシフト下での検出を多段階のプロセスとして扱う統一的な問題定式化を提案し、適応パラダイム、前提、パイプライン構成要素に基づいて既存手法をタクソノミ(分類体系)として整理する。
  • ドメインシフトが物体検出の各段階にどのように伝播するかを説明し、検出は分類よりも適応が複雑であると論じる。これは、局在化や分類など複数の構成要素が影響を受けるためである。
  • 調査では、データセット、評価プロトコル、ベンチマーク手法をレビューし、文献の断片化と、構造的な課題に関する統一的な視点の欠如を強調する。
  • 結論では、根強い課題を特定し、より頑健なクロスドメイン検出システムを可能にする有望な今後の研究方向性を示す。

Abstract

ソースドメインで訓練された物体検出モデルは、センシング条件、環境、データ分布などのさまざまな変動により、未知のターゲットドメインへ展開すると大きな性能劣化を示すことが多い。したがって、深層学習ベースの検出技術における最近のブレークスルーがあったとしても、ドメイン間物体検出(CDOD)は依然として重要な研究領域である。さらに、既存文献は分断された状態にとどまっており、ドメインシフトの構造的な課題と適応戦略の有効性に関する統一的な視点が欠けている。本サーベイは、CDODを包括的かつ体系的に分析する。まず、ドメインシフト下における物体検出が多段階であることを強調する問題設定から始める。次に、適応パラダイム、モデリング上の仮定、パイプライン構成要素に基づいてアプローチを分類する概念的タクソノミにより、既存手法を整理する。さらに、ドメインシフトが検出の各段階にどのように伝播するかを分析し、分類に比べて物体検出における適応が本質的により複雑である理由を論じる。また、よく用いられるデータセット、評価プロトコル、ベンチマーク手法を概観する。最後に、主要な課題を特定し、有望な今後の研究方向性を概説する。本サーベイは一貫して、CDODを理解するための統一的な枠組みを提供し、より頑健な検出システムの開発を導くことを目的とする。