要旨: Domain Adaptive Object Detection (DAOD) は、ラベル付きソースドメインからラベルなしターゲットドメインへ検出器を移行することを目指します。既存のDAOD手法は、多階層の特徴整列を用いて、ドメイン不変表現を学習します。しかし、それらのCNNベースのバックボーンと検出ヘッドの局所的な結合性は、整列を局所領域に制限し、グローバルなドメイン不変特徴を抽出できません。ただし、トランスフォーマーベースのDAOD手法はアテンション機構を介してグローバルな依存関係を捉えますが、その計算コストは二次的であり、実用化を妨げます。これを解決するため、我々は DA-Mamba を提案します。これは、CNN の効率と State Space Models (SSMs) の線形時間の長距離モデリング能力を組み合わせたハイブリッドな CNN-State Space Models(SSMs)アーキテクチャで、グローバルおよびローカルのドメイン不変特徴の両方を捉えます。具体的には、二つの新規モジュールを導入します:Image-Aware SSM (IA-SSM) および Object-Aware SSM (OA-SSM)。IA-SSM はバックボーンに組み込まれ、グローバルなドメイン認識を強化し、画像レベルでのグローバルおよび局所の整列を可能にします。OA-SSM は検出ヘッドに挿入され、物体間の空間的および意味的依存関係をモデル化し、インスタンスレベルの整列を強化します。包括的な実験により、提案手法が検出器のクロスドメイン性能を効率的に向上させることを示しています。
DA-Mamba: ドメイン認識状態空間モデルを学習し、ドメイン適応物体検出におけるグローバル-ローカル整合を実現する
arXiv cs.CV / 2026/3/20
📰 ニュースModels & Research
要点
- DA-Mambaは、局所的なディテールと長距離依存性の両方を線形時間計算量で捉えるハイブリッドCNN-状態空間モデル(SSM)アーキテクチャを提案し、ドメイン適応物体検出を強化する。
- バックボーンには Image-Aware SSM(IA-SSM)を導入し、画像レベルのグローバル/ローカル整合を実現し、検出ヘッドには Object-Aware SSM(OA-SSM)を導入して、物体間の空間的および意味的依存関係をモデリングする。
- 本手法はCNNの効率性とSSMを組み合わせ、長距離モデリングを線形時間で実現し、トランスフォーマーに基づくアプローチの二次的計算コストを削減する。
- DAODベンチマークでの実験は、ドメイン間の性能と効率性の向上を示し、提案手法の有効性を示している。

