概要: 360{\deg}ドローンで撮影した画像から再構成した3D Gaussian Splatting(3DGS)シーンにおいて、室内の対象となる資産を対象レベルで検出およびセグメンテーションするためのアプローチを提案します。本手法では、対応するガウシアン・プリミティブのマスク意味論と空間情報を共同で活用する3Dオブジェクト・コードブックを導入し、マルチビューのマスク対応付けと室内資産の検出を導きます。さらに、意味論的かつ空間的に制約されたマージ手順により、2Dの物体検出およびセグメンテーションモデルを統合することで、複数ビューからのマスクを、首尾一貫した3Dの物体インスタンスとして集約します。2つの大規模な室内シーンでの実験により、信頼性の高いマルチビューのマスク整合性が示され、最先端のベースラインに比べてF1スコアを65%向上させることができます。また、正確な対象レベルの3D室内資産検出を実現し、ベースライン手法に対してmAPを11%向上させています。
大規模360°ドローン撮影画像から復元した3Dガウススプラッティングによる屋内アセット検出
arXiv cs.CV / 2026/4/8
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、大規模な360°ドローン画像から再構成された3Dガウススプラッティング(3DGS)シーンに対し、屋内アセットのオブジェクト単位の検出およびセグメンテーション手法を提案する。
- マスクの意味論とガウスプリミティブの空間属性を組み合わせて、多視点におけるマスクの対応付けを改善する「3D object codebook」を導入する。
- 本手法は、意味論的および空間的な制約を用いて複数視点からの2D検出/セグメンテーション出力を統合し、整合的な3Dオブジェクトインスタンスを形成する。
- 2つの大規模な屋内シーンでの実験により、多視点におけるマスクの一貫性が強いことが示され、最先端のベースラインに対してF1が65%改善する。
- 3D屋内アセット検出では、本手法はベースライン手法に比べてmAPを11%向上させる。




