GeoGuide: オープンボキャブラリー3D意味セグメンテーションのための階層的幾何学ガイダンス
arXiv cs.AI / 2026/3/30
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- GeoGuideは、学習時に見たことのないカテゴリにも対応するオープンボキャブラリー3D意味セグメンテーションで、従来の2D表現への蒸留中心の手法が抱える幾何学習の制約や2D誤差の継承を改善することを目的とした新しい枠組みです。
- 不確実性推定つきSuperpoint蒸留により、幾何と意味の特徴を不確実性推定を伴って統合し、superpoint内で2D特徴を状況に応じて重み付けすることでノイズを抑えつつ弁別情報を保持します。
- インスタンスレベルのマスク復元では、幾何プリオリを用いてインスタンスごとのマスクを復元し、インスタンス内部の意味的一貫性を高めます。
- インスタンス間関係の整合性では、幾何・意味の類似度行列を整合させることで、同一カテゴリの物体間の整合性を視点による意味のドリフトを抑えながら校正します。
- ScanNet v2、Matterport3D、nuScenesにおける広範な実験で、GeoGuideが既存手法より高い性能を示したと報告されています。
