動的な屋内環境における少数ショットの逐次的3D物体検出

arXiv cs.CV / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、新しい物体クラスが時間とともに現れる動的な屋内環境を対象とした、少数ショットの逐次的（インクリメンタル）3D物体検出フレームワークFI3Detを提案する。
FI3Detはベース段階で視覚言語モデル（VLM）を用いて「未知」物体をマイニングし、2Dの意味特徴およびクラス非依存の3Dバウンディングボックスを含む、未見カテゴリに対する表現を学習する。
マイニングされた表現のノイズを抑えるために、空間位置と特徴の一貫性に基づいて、点単位およびボックス単位の寄与を再重み付けする重み付けメカニズムを追加する。
分類のためにFI3Detは、2Dの意味特徴と3Dの幾何特徴をアラインしてプロトタイプを形成し、マルチモーダルな分類信号を統合して、新規検出を行う「ゲート付きマルチモーダル・プロトタイプ・インプリンティング」を提案する。
ScanNet V2およびSUN RGB-Dでのバッチ評価と逐次評価の実験により、ベースライン手法に対して一貫した改善が示され、著者らはGitHubでコードを公開している。

AI Business

日経XTECH

日経XTECH

日経XTECH

Reddit r/artificial