PanopticQuery: Unified Query-Time Reasoning for 4D Scenes
arXiv cs.CV / 4/8/2026
📰 NewsIdeas & Deep AnalysisModels & Research
Key Points
- PanopticQueryは、動的な4Dシーンを自然言語で問い合わせる際に、空間・時間・視点をまたいだ意味づけ(セマンティック・グラウンディング)を統一的に行う枠組みを提案しています。
- 4D Gaussian Splattingによる高忠実な動的再構成に加え、多視点・複数時刻の2Dセマンティック予測を合意形成(コンセンサス)して一貫性のない出力を除去し、幾何学整合性を保ちながら4Dの構造化グラウンディングへ引き上げます。
- これにより、属性だけでなく、時間的な行為(アクション)、空間関係、複数物体の相互作用といった複雑なセマンティクスを扱うことを目指しています。
- 評価のために新ベンチマークPanoptic-L4Dを導入し、複雑な言語クエリにおいて従来手法を上回るSOTA結果を示したと報告しています。
Related Articles

Meta Superintelligence Lab Releases Muse Spark: A Multimodal Reasoning Model With Thought Compression and Parallel Agents
MarkTechPost

Chatbots are great at manipulating people to buy stuff, Princeton boffins find
The Register

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.
Dev.to
v0.20.5
Ollama Releases

Charades-Ego: A Large-Scale Dataset of Paired Third and First Person Videos
Dev.to