Stepper:マルチビュー・パノラマによる段階的な没入型シーン生成
arXiv cs.CV / 2026/4/1
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- Stepperは、ワンショットまたは完全に自己回帰的な手法ではなく、パノラマシーンを段階的に拡張することで没入型の3Dシーンを生成する、新しいテキスト駆動フレームワークです。
- 一貫性を維持し、同一の高解像度パノラマ拡張を可能にするためのマルチビュー360°拡散モデルを導入します。
- 幾何学的なコヒーレンスを強制し、構造の不整合などの失敗を低減するために、幾何再構成パイプラインが用いられます。
- 新たに作成された大規模なマルチビュー・パノラマデータセットで学習されており、従来手法に対して最高水準の忠実度と構造一貫性を達成すると報告されています。




