Vista4D:4Dポイントクラウドを用いたビデオリシューティング
arXiv cs.CV / 2026/4/24
📰 ニュースModels & Research
要点
- Vista4Dは、4Dポイントクラウドによって入力動画とターゲットカメラを幾何とダイナミクスの両面で結び付け、シーンを再合成するビデオリシューティングのフレームワークである。
- 本手法は、従来手法にありがちな課題である実世界の動的映像における深度推定アーティファクト、コンテンツの見た目の劣化、新しい軌道でのカメラ制御の不正確さに対処する。
- 静的ピクセル分割と4D再構成を用いて4Dに基づく表現を構築し、観測されたコンテンツを明示的に保持しつつ、カメラに関する豊富な信号を提供する。
- 再構成したマルチビューの動的データで学習することで、実運用の推論時にポイントクラウド由来のアーティファクトに対する頑健性を高める。
- 実験では、複数の動画とカメラ経路において、最先端ベースラインよりも4Dの整合性、カメラ制御、視覚品質が向上し、動的シーン拡張や4Dシーン再構成といった実世界アプリケーションにも汎用することが示されている。


