EgoSim:身体化されたインタラクション生成のための自己中心的ワールド・シミュレータ
arXiv cs.CV / 2026/4/2
📰 ニュースSignals & Early TrendsModels & Research
要点
- EgoSimは、空間的に一貫したインタラクション動画を生成するために設計されたクローズドループの自己中心的(egocentric)3Dワールド・シミュレータであり、多段階のインタラクションを通じて基盤となる3Dシーン状態を持続的に更新します。
- 本手法は、幾何構造と行動を意識した観測シミュレーション・モデルと、インタラクションを意識した状態更新モジュールを組み合わせることで、構造ドリフトを抑え、シミュレーション中の非静的な環境変化にも対応します。
- 整合された学習データが乏しいという課題に対して、EgoSimは、大規模な野外のモノラル自己中心的動画からポイントクラウド、カメラ軌道、身体化(embodiment)アクションを抽出するスケーラブルなパイプラインを用います。
- 付随する低コストのキャプチャシステム「EgoCap」は、校正されていないスマートフォンを使って現実世界のデータを収集し、より幅広い学習と評価を可能にします。
- 実験結果として、EgoSimは視覚品質、空間的整合性、複雑なシーンへの汎化、ならびにロボットによるマニピュレーションにおける身体(エンボディメント)をまたいだ転移の面で、先行手法を上回ると報告されています。コードとデータセットは近日公開予定です。




