要旨: 身体性を備えた(embodied)エージェントは、動的な物理環境の中で永続的に動作し、時間の経過とともに新しい能力を継続的に獲得することが期待されます。エージェントの性能を向上させる既存の手法は、多くの場合、プロンプトエンジニアリング、ポリシー更新、または構造的な再設計といった形で、エージェントそのものを変更することに依存しています。その結果、長寿命のシステムでは不安定化や、アイデンティティの喪失が生じます。本研究では、身体性エージェントのための「能力中心の進化(capability-centric evolution)」パラダイムを提案します。具体的には、ロボットは認知的なアイデンティティとして永続的なエージェントを維持すべきであり、能力の進化を通じて継続的に改善を可能にするべきだと主張します。そこで、Embodied Capability Modules(ECM:身体性能力モジュール)の概念を導入します。これは、身体性を備えた機能を表す、学習され、洗練され、時間の経過とともに組み合わされ得る、モジュール化されたバージョン管理単位です。本研究では、能力の進化をエージェントのアイデンティティから切り離す統一的な枠組みを提示します。能力は、タスク実行、経験の収集、モデルの洗練、モジュール更新を含む閉ループ過程によって進化し、同時に、すべての実行は安全性およびポリシー制約を強制するランタイム層によって統治されます。シミュレーション上の身体性タスクを通じて、能力の進化が、20イテレーションでタスク成功率を32.4%から91.3%へ改善することを示します。さらに、エージェント改変のベースラインおよび確立されたスキル学習手法(SPiRL、SkiMo)の両方を上回り、ポリシードリフトゼロおよび安全性違反ゼロを維持します。これらの結果は、エージェントのアイデンティティを能力の進化から分離することが、長期的な身体性知能に対してスケーラブルで安全な基盤を提供し得ることを示唆しています。
アイデンティティを失わずに学習する:身体化エージェントの能力進化
arXiv cs.RO / 2026/4/10
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、寿命の長い身体化エージェントは、エージェント自体を不安定化させることなく、能力を継続的に向上させながら永続的な認知的アイデンティティを維持すべきだと主張する。
- 身体化機能を、学習・改良・経時的な合成により扱えるモジュール化されたバージョン管理済みユニットであるEmbodied Capability Modules(ECM)を導入する。
- 能力更新が、タスク実行、経験の収集、モデルの洗練、モジュール更新というクローズドループによって行われる、能力中心の統一的な進化フレームワークを提案する。
- 実行中に安全性とポリシー制約を強制するためのランタイム層を用い、ポリシーのドリフトや危険な振る舞いを防ぐことを目指す。
- 模擬環境での身体化タスクにおいて、この手法は20回の反復で成功率を32.4%から91.3%へと引き上げ、エージェント改変や既存のスキル学習のベースラインを上回るとともに、ポリシードリフトゼロおよび安全違反ゼロを報告している。


