要旨: 共通の自律(shared autonomy)は、人間のユーザとAIコパイロットの行動を組み合わせて、ロボットアームのような複雑なシステムを制御します。タスクが難しい場合、高次元の制御が必要な場合、または汚染(corruption)の影響を受ける場合、学習済みのコパイロットを用いて、ユーザの目標に整合する形でユーザの行動を効果的に修正することで、共通の自律はタスク性能を大幅に向上させ得ます。共通の自律の性能を大きく改善するために、拡散シーケンスコパイロット(Diffusion Sequence Copilots; DiSCo)を提案します。DiSCoは、過去のユーザ行動と整合する行動系列を計画する拡散ポリシーを用いた共通の自律の手法です。DiSCoは、超パラメータによって、専門家の行動への適合度、ユーザの意図との整合性、そして知覚される応答性のバランスを取りながら、ユーザが提供した行動で拡散プロセスをシードし、インペイント(欠損補完)します。シミュレーションによる運転タスクおよびロボットアームのタスクにおいて、DiSCoがタスク性能を大きく改善することを示します。プロジェクトのWebサイト: https://sites.google.com/view/disco-shared-autonomy/
DiSCo:共有オートノミーのための拡散シーケンス・コパイロット
arXiv cs.RO / 2026/3/25
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文では、AIコパイロットがロボットアームやシミュレーション上の運転のような複雑な制御タスクにおいて、ユーザーの行動を修正し補完することで協調する共有オートノミーのアプローチとして、拡散シーケンス・コパイロット(DiSCo)を提案する。
- DiSCoは、ユーザーの過去の行動と整合する行動シーケンスを計画するために拡散ポリシーを用い、ユーザーが提供した入力を用いて拡散過程をシーディングし、インペインティングすることで整合性を保つ。
- 本手法には、専門家らしい行動との一致、ユーザーの意図への整合、ユーザーに対する応答性の感覚といった要素の間でトレードオフを行う調整可能なハイパーパラメータが含まれている。
- シミュレーション運転およびロボットアームのタスクに関する実験により、DiSCoは先行する共有オートノミーの挙動と比べて、タスク性能を大幅に改善することが示される。
- 本研究は、拡散ベースの計画を、難しいタスクや高次元の制御要求、さらにユーザー入力の潜在的な破損に対する頑健性を実現するための実用的な仕組みとして位置づけている。
