UniCon3R：単眼動画からの接触認識型3D人・シーン復元

arXiv cs.CV / 2026/4/23

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

UniCon3Rは、単眼動画からのリアルタイム4D人・シーン復元のためのフィードフォワード型フレームワークを提案し、世界座標での人体運動とシーン幾何を同時に推定します。
従来手法で見られる物理的に不自然なアーティファクト（たとえば地面から浮く・シーンにめり込む）は、人と環境の物理的相互作用をモデル化できていないことが主因だと述べています。
UniCon3Rは、人体ポーズとシーン形状から3D接触を推定し、最終的なポーズ生成の際に接触を単なる補助信号ではなく能動的な補正手がかりとして用います。
RICH、EMDB、3DPW、SLOPER4Dでの実験により、既存の最先端ベースラインに比べて物理的妥当性とグローバルな人体運動推定が向上し、かつリアルタイムのオンライン推論も実現しています。
著者らは、接触が外部指標ではなく物理的に根ざした復元のための強力な内部事前知識として機能すると主張し、この分野に新しいパラダイムを示したとしています。