IGLOSS: Lidarのオープン語彙意味セグメンテーションのための画像生成
arXiv cs.CV / 2026/4/3
📰 ニュースSignals & Early TrendsModels & Research
要点
- IGLOSSは、3D自動車用LiDAR点群に特化した、新しいゼロショットのオープン語彙意味セグメンテーション手法を提案する。
- CLIPのようなVLMに頼る代わりに、画像とテキストのモダリティギャップに苦しむ点を回避するため、テキストからプロトタイプ画像を生成してモダリティ間の橋渡しを行う。
- システムは、2Dの視覚基盤モデルから蒸留した3Dネットワークを用い、生成されたプロトタイプから抽出した2D特徴と3D点特徴を照合することでラベル付けする。
- 本論文は、nuScenesおよびSemanticKITTIデータセットにおけるOVSSで最先端の性能を報告している。
- 著者らは、GitHubリポジトリを通じてコード、事前学習済みモデル、生成画像を公開している。




