MV3DIS: 3Dガイドによるマルチビュー・マスクマッチングを用いたゼロショット3Dインスタンスセグメンテーション

arXiv cs.CV / 2026/4/13

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ゼロショット3Dインスタンスセグメンテーションにおいて、ビュー間の相関や3Dプリオルを十分に活かせていない従来手法の限界を指摘しています。
  • MV3DISは、粗い3Dセグメントを共通参照として2Dマスクをマルチビューでマッチさせ、3Dカバレッジ分布で一貫性を強化する「3Dガイド付きマスクマッチング」を提案します。
  • さらに、深度整合性に基づく重み付けで投影の信頼性を定量化し、物体間の遮蔽による対応の曖昧さを抑えてロバスト性を高めます。
  • ScanNetV2/200、ScanNet++、Replica、Matterport3Dの広範な実験で、従来手法より高い性能を達成したと報告しています。