PanopticQuery: 4Dシーンのための統一されたクエリ時推論
arXiv cs.CV / 2026/4/8
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- PanopticQueryは、動的な4Dシーンを自然言語で問い合わせる際に、空間・時間・視点をまたいだ意味づけ(セマンティック・グラウンディング)を統一的に行う枠組みを提案しています。
- 4D Gaussian Splattingによる高忠実な動的再構成に加え、多視点・複数時刻の2Dセマンティック予測を合意形成(コンセンサス)して一貫性のない出力を除去し、幾何学整合性を保ちながら4Dの構造化グラウンディングへ引き上げます。
- これにより、属性だけでなく、時間的な行為(アクション)、空間関係、複数物体の相互作用といった複雑なセマンティクスを扱うことを目指しています。
- 評価のために新ベンチマークPanoptic-L4Dを導入し、複雑な言語クエリにおいて従来手法を上回るSOTA結果を示したと報告しています。



