要旨: 身体性のあるAI研究(embodied AI research)は、単一タスク・単一環境での方策学習から、複数タスク、複数シーン、複数モデルの設定へとますます移行しつつあります。この変化により、評価環境の構築、軌道(トラジェクトリ)の収集、モデル学習、評価などの段階に必要となるエンジニアリング上のオーバーヘッドと開発時間が大幅に増加します。この課題に対処するために、私たちは身体性のあるAI開発のための新しいパラダイムを提案します。そこでは、ユーザが会話によって目標と制約を表現し、システムが開発ワークフローを自動的に計画し、実行します。このパラダイムを、EmbodiedClawという会話型エージェントとして具体化します。EmbodiedClawは、環境の作成と改訂、ベンチマークの変換、軌道の合成、モデルの評価、アセットの拡張など、高頻度かつ高コストな身体性のある研究活動を、実行可能なスキルへと変換します。エンドツーエンドのワークフロタスクに関する実験、能力に特化した評価、人間の研究者による調査、およびアブレーションにより、EmbodiedClawは、実行可能性、整合性、再現性を向上させながら、手作業のエンジニアリング工数を削減することが示されます。これらの結果は、身体性のあるAI開発において、手作業のツールチェーンから、会話によって実行可能なワークフローへと移行することを示唆しています。
EmbodiedClaw: 身体化AI開発のための会話型ワークフロー実行
arXiv cs.RO / 2026/4/16
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- EmbodiedClawは、研究者が会話によって目標と制約を指定し、それに基づいてシステムがワークフローを計画・自動実行する、新しい身体化AI開発のパラダイムを提案する。
- この手法は、身体化AIの多タスク・多シーン・多モデルのセットアップ段階における大きなエンジニアリング負担、すなわち評価環境の作成、軌跡(トラジェクトリ)の収集、学習、評価を含む部分を対象としている。
- EmbodiedClawは、会話型エージェントとして実装され、高コストで頻度の高い研究作業(例:環境の作成・改訂、ベンチマークの変換、軌跡の合成、モデル評価、アセット拡張)を実行可能なスキルへと変換する。
- エンドツーエンドのワークフロー課題、能力に特化した評価、人間の研究者を対象とした研究、およびアブレーションの実験結果から、手作業によるエンジニアリング工数が削減されると同時に、実行可能性、一貫性、再現性の向上が示される。




