Abstract
検出器はしばしば性能の低下に悩まされますが、その主因は、ソース領域とターゲット領域の間に分布のギャップが存在することです。この問題は、データが限られた単一ソース領域において特に顕著です。というのも、モデルはソース領域からの交絡因子(たとえば、照明、共起、スタイル)に依存しがちであり、その結果、汎化を阻む見かけ上の相関(spurious correlations)が生まれるからです。そこで本論文では、因果推論を物体検出に取り入れた、領域一般化のための新しいBasis駆動フレームワーク、すなわち extbf{ extit{Bridge}} を提案します。前方ドア調整(front-door adjustment)用の低ランク基底を学習することで、 extbf{ extit{Bridge}} は交絡因子の影響を遮断し、見かけ上の相関を緩和します。さらに同時に、冗長でタスクに無関係な成分をフィルタリングすることで表現を洗練します。extbf{ extit{Bridge}} は、識別的(例: DINOv2/3、SAM)および生成的(例: Stable Diffusion)なビジョン基盤モデル(VFM)の両方に、シームレスに統合できます。複数の領域一般化の物体検出データセット、すなわち Cross-Camera、Adverse Weather、Real-to-Artistic、Diverse Weather Datasets、および Diverse Weather DroneVehicle(本研究で新たに拡充した、現実世界のUAVベースのベンチマーク)にわたる大規模な実験により、提案手法が従来の最先端手法よりも優れていることが示されます。プロジェクトページは以下で利用可能です: https://mingbohong.github.io/Bridge/.




