TFusionOcc：Tプリミティブに基づくオブジェクト中心マルチセンサー融合フレームワークによる3D占有予測

arXiv cs.RO / 2026/4/22

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

本論文は、自動運転のためのシーン理解向上を目的とした3Dセマンティック占有予測のためのオブジェクト中心マルチセンサー融合フレームワークTFusionOccを提案しています。
ボクセル表現やガウスプリミティブにおける制約を、Students t分布に基づくTプリミティブ幾何を導入することで克服し、プレーン、T-Superquadric、逆ウォーピングを伴う変形可能T-Superquadricを含むプリミティブ群を提示しています。
Students t分布とT-mixture model（TMM）を用いた統一的な確率論的定式化により、占有とセマンティクスを同時にモデリングします。
カメラとLiDARの手がかりを効果的に統合するために、密結合のマルチステージ融合アーキテクチャを設計しています。
nuScenesで最先端性能を達成し、nuScenes-Cで多くの破損シナリオに対して高いロバスト性を示し、コードはGitHubで公開予定です。

要旨: 3Dセマンティック占有の予測により、自動運転車（AV）が安全なナビゲーションと意思決定のために、きめ細かな幾何学的およびセマンティックなシーン構造を認識できるようになります。既存手法の多くは、空の領域に対して冗長な計算が発生するボクセルベース表現、または複雑で非凸かつ非対称な構造のモデリングに限界があるオブジェクト中心のガウスプリミティブのいずれかに主に依存しています。本論文では、3Dセマンティック占有予測のための、Tプリミティブに基づくオブジェクト中心のマルチセンサ融合フレームワークであるTFusionOccを提案します。具体的には、素のTプリミティブ、T-Superquadric、逆ワーピングを伴う変形可能T-Superquadricを含む、Studentのt分布ベースのプリミティブの系列を導入します。ここで、変形可能T-Superquadricが主要な幾何学的特徴強化プリミティブとして機能します。さらに、Studentのt分布とTミクスチャモデル（TMM）に基づく統一的な確率定式化を発展させ、占有とセマンティクスを同時にモデル化し、カメラとLiDARの手がかりを効果的に統合するための、密結合されたマルチステージ融合アーキテクチャを設計します。nuScenesに関する大規模な実験により最先端の性能が示され、加えてnuScenes-Cでの追加評価では、ほとんどの破損シナリオにおいて強い頑健性が確認されます。コードは以下で公開予定です: https://github.com/DanielMing123/TFusionOcc