3Dシーン理解のための基盤モデルへ向けて:ポイントクラウドに対するインスタンス認識型自己教師あり学習
arXiv cs.CV / 2026/3/27
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- arXiv論文では、人手によるラベルなしでポイントクラウドから3Dシーン理解を向上させることを目的とした、インスタンス志向の自己教師あり学習フレームワーク「PointINS」を提案している。
- 現行のSSL手法は主にセマンティクス認識を最適化している一方で、インスタンスの位置特定への転移は弱いと主張し、より一般的な「3D基盤モデル」表現への進展が必要だとしている。
- PointINSは直交オフセット分岐を導入し、幾何学に配慮した制約によってインスタンス認識を高めるための2つの正則化戦略—Offset Distribution Regularization(ODR)とSpatial Clustering Regularization(SCR)—を用いる。
- 5つのデータセットにわたる実験により、屋内インスタンスセグメンテーションで平均+3.5% mAP、屋外パンオプティックセグメンテーションで平均+4.1% PQが得られ、下流タスクへの転移とインスタンスレベルの性能が向上することを示唆している。



