Gau-Occ:マルチモーダル 3D 占有予測のための幾何学的に完成されたガウシアン
arXiv cs.CV / 2026/3/25
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- Gau-Occ は、自動運転向けの 3D セマンティック占有予測を、シーンを「コンパクトなセマンティック3Dガウスの集合」として表現することで、密なボクセル/BEV 処理を回避しつつ高精度化するマルチモーダル枠組みです。
- LiDAR が疎な状況で欠落構造を補うために LiDAR Completion Diffuser (LCD) を提案し、ロバストな Gaussian anchor の初期化を実現します。
- マルチビュー画像の意味情報は、幾何整合された 2D サンプリングとクロスモーダル整合(Gaussian Anchor Fusion: GAF)により効率よく統合され、空間整合と意味識別性の両立を狙います。
- 実験では複数の難度が高いベンチマークで最先端性能を示し、同時に計算効率でも大きな利点があると報告されています。
