Edit-As-Act: オープンボキャブラリ対応の3D室内シーン編集におけるゴール回帰型計画
arXiv cs.CV / 2026/3/19
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- Edit-As-Actは、オープンボキャブラリの3D室内シーン編集に対するゴール回帰型計画フレームワークを提案し、ユーザー指示を最小限かつ的確な変更で実現することを目指す。
- EditLangは、接触や衝突といった幾何学的関係を明示的な前提条件と効果として記述する、PDDLに触発されたアクション言語である。
- 言語駆動型プランナーがアクションを提案し、検証器はゴール指向性・単調性・物理的実現可能性を担保して、解釈可能で物理的に整合した編集を保証する。
- 推論と低レベル生成を分離することにより、Edit-As-Actは従来のオープンボキャブラリ手法と比較して、指示の忠実度、意味的一貫性、および物理的妥当性を向上させる。
- E2A-Benchベンチマーク(63タスク、9環境)において、本手法はすべての編集タイプおよびシーンカテゴリで従来の手法を大きく上回る。