広告

UniDAC:あらゆるカメラに対応するユニバーサルなメートル深度推定

arXiv cs.CV / 2026/3/31

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • UniDACは、単一のモデルで多様なカメラタイプ(魚眼や360°を含む)にまたがる汎化を実現することを目的とした、新しい単眼メートル深度推定フレームワークであり、複数の領域固有モデルではなく1つのモデルを用います。
  • この手法は、メートル深度推定を「相対深度の予測」と「空間的に変化するスケール推定」に分解することで、カメラ間のロバスト性を向上させます。
  • 粗いスケールマップを高解像度へアップサンプリングする、軽量な「Depth-Guided Scale Estimation(深度ガイド付きスケール推定)」モジュールを導入し、相対深度マップを用いて局所的なスケール変動に対応します。
  • UniDACはさらに、等距離射影(equi-rectangular)における空間的なワーピングを考慮する、歪みを意識した位置埋め込み(RoPE-φ)を提案しており、緯度に応じた重み付けによってこれを扱います。
  • 本論文では、カメラ間汎化において最先端の性能を報告しており、評価した各データセットにおいて一貫して従来手法を上回っています。

Abstract

Monocular metric depth estimation (MMDE) is a core challenge in computer vision, playing a pivotal role in real-world applications that demand accurate spatial understanding. Although prior works have shown promising zero-shot performance in MMDE, they often struggle with generalization across diverse camera types, such as fisheye and 360^\circ cameras. Recent advances have addressed this through unified camera representations or canonical representation spaces, but they require either including large-FoV camera data during training or separately trained models for different domains. We propose UniDAC, an MMDE framework that presents universal robustness in all domains and generalizes across diverse cameras using a single model. We achieve this by decoupling metric depth estimation into relative depth prediction and spatially varying scale estimation, enabling robust performance across different domains. We propose a lightweight Depth-Guided Scale Estimation module that upsamples a coarse scale map to high resolution using the relative depth map as guidance to account for local scale variations. Furthermore, we introduce RoPE-\phi, a distortion-aware positional embedding that respects the spatial warping in Equi-Rectangular Projections (ERP) via latitude-aware weighting. UniDAC achieves state of the art (SoTA) in cross-camera generalization by consistently outperforming prior methods across all datasets.

広告