自動運転のためのインスタンス中心型パノプティック占有予測ベンチマーク

arXiv cs.CV / 2026/3/31

📰 ニュースSignals & Early TrendsModels & Research

共有:

要点

本論文は、統一された3次元シーンにおいてボクセル単位の意味クラスとインスタンス同一性を同時に予測することを目的とした、3Dパノプティック占有予測のための新しいインスタンス中心型ベンチマークを提案する。
主要なデータセットの不足に対処するため、自動運転に特化した3DメッシュライブラリであるADMeshを公開する。高品質モデル15K+、多様なテクスチャ、豊富なセマンティック注釈を備える。
さらに、物理的に整合性のあるパノプティック占有データセットであるCarlaOccも公開する。CARLA生成のフレーム100K+を含み、0.05m解像度までインスタンス単位のボクセル占有のグラウンドトゥルースを提供する。
著者らは標準化された評価指標を提案し、代表的なモデルでベンチマークを実施することで、公平な比較と再現可能な研究を可能にする。
リソース（コードとデータセット）はプロジェクトリンクで公開されており、3Dパノプティック知覚研究へのより広範な採用を支援する。

要旨: パノプティック占有予測は、統一された3Dシーン表現の中で、ボクセル単位の意味論とインスタンス同一性を同時に推論することを目指します。とはいえ、この分野の進展は、高品質な3Dメッシュリソース、インスタンスレベルの注釈、物理的に整合した占有データセットの欠如によって依然として制約されています。既存のベンチマークは一般に、インスタンスレベルの注釈を欠いた不完全で低解像度のジオメトリを提供しており、精密な幾何学的復元、信頼性の高い遮蔽（オクルージョン）推論、そしてホリスティックな3D理解を達成できるモデルの開発を妨げています。これらの課題に対処するため、本論文では、3Dパノプティック占有予測タスクのためのインスタンス中心のベンチマークを提示します。具体的には、自動運転向けに特化した最初の統合3DメッシュライブラリであるADMeshを導入し、多様なテクスチャと豊富な意味論的注釈を備えた15K超の高品質3Dモデルを統合します。ADMeshに基づいて、さらにCARLAシミュレータを用いて生成した、大規模かつ物理的に整合したパノプティック占有データセットであるCarlaOccを構築します。このデータセットは100K超のフレームを含み、ボクセル解像度0.05mまでの微細な、インスタンスレベルの占有グラウンドトゥルースを提供します。さらに、既存の占有データセットの品質を定量化するための標準化された評価指標も導入します。最後に、提案データセット上で代表的なモデルの体系的なベンチマークを確立し、この分野における公正な比較と再現可能な研究のための統一的なプラットフォームを提供します。コードとデータセットは https://mias.group/CarlaOcc で入手可能です。