ArchSym:実環境画像における3D基盤の建築対称性の検出

arXiv cs.CV / 2026/4/27

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、建築ランドマークを対象に、単一の実環境(in-the-wild)RGB画像から3D基盤の反射対称性を検出する初の枠組みを提案しています。
  • SfM再構成とクロスビューの画像マッチングを活用して、大規模データセットArchSymを構築するスケーラブルなアノテーション手法を導入しています。
  • さらに、予測したシーン幾何に相対する符号付き距離マップとして対称性を表現し、単一ビューで3D上に対称性を正確に位置推定する検出器を開発しています。
  • 実験ではアノテーション手法を幾何ベースの代替案と照合し、新しいベンチマーク上で検出器が既存の最先端ベースラインを大きく上回ることを示しています。
  • 動機は、既存手法が物体中心/合成データでの学習・評価に偏っており実環境へ一般化しにくい点、および単眼入力に固有のスケール曖昧性により3D平面の特定が難しい点にあります。

要旨: 対称性の検出はコンピュータビジョンにおける基本的な問題であり、対称性は下流タスクに対する強力な事前知識(プリオル)として機能します。しかし、単一画像から3D対称性を検出するための既存の学習ベース手法は、ほとんどが物体中心(object-centric)または合成(synthetic)データセットで訓練・評価されてきたため、現実世界のシーンに対して汎化できません。さらに、単眼入力には固有のスケールの曖昧性があるため、3D平面を局在化することが不適切な問題となり、多くの既存研究では平面の向き(orientation)だけを予測しているにとどまっています。本論文では、建築的ランドマークに焦点を当てつつ、野外の単一RGB画像から3Dに根ざした反射対称性を検出するための最初の枠組みを提示することで、これらの制約に対処します。2つの重要な革新点を導入します: (1) 複数視点間の画像マッチングを活用することで、SfM再構成(reconstructions)から建築対称性の大規模データセット ArchSym を自動的に編集・構築する、スケーラブルなデータ注釈パイプライン。さらに、このデータセットに基づき、(2) 予測されたシーン幾何に相対的に定義された符号付き距離マップとしてそれらをパラメータ化することにより、3D空間内で対称性を正確に局在化する単一視点の対称性検出器を提案します。対称性注釈パイプラインを幾何ベースの代替手法と照合して検証し、新しいベンチマークにおいて、提案する対称性検出器が最先端のベースラインを大幅に上回ることを示します。