COSMIK-MPPI:近接する動的な人間環境における衝突回避への、制約付きモデル予測制御のスケーリング

arXiv cs.RO / 2026/4/14

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、トルク制御ロボットマニピュレータと人間との間で、近接した距離にありかつ動的な環境において安全制約を遵守しつつ、衝突のない物理的相互作用を実現するという課題に取り組む。
  • COSMIK-MPPIという衝突回避のための枠組みを提案し、MPPI制御にRT-COSMIKの人間の運動推定システムと、制約を終了条件として扱うConstraints-as-Terminations手法を組み合わせることで、大きなペナルティ項に依存せずに安全性を強制する。
  • 制約違反を終端イベントとして扱うことで、バニラMPPIで用いられる加法的ペナルティ方式よりも、制約充足をより確実にすることを目指す。
  • 実験の結果、COSMIK-MPPIは実機マニピュレータでのテストにおいてタスク成功率100%を達成し、計算時間は約22 msと一定であり、評価設定において勾配ベースのMPCを大幅に上回る。
  • さらに、実行不可能なシナリオを含むシミュレーションでは、COSMIK-MPPIはバニラMPPIとは異なり一貫して衝突のない軌道を生成する。これにより、手頃なマーカーレス推定器を用いて、頑健なヒューマン・ロボット協働共有作業空間の実行を可能にする。

Abstract

トルク制御型マニピュレータと人間との間で安全な物理的相互作用を確実に行うことは、ロボットを日常環境で展開するために不可欠です。モデル予測制御(MPC)は、ハード制約を扱えること、強力な保証を提供できること、そして予測推論によってゼロショット適応性を実現できることから、適切な枠組みとして注目されています。しかし、勾配ベースMPC(GB-MPC)ソルバは、複雑な環境における衝突回避の性能が限定的であることが示されています。モデル予測経路積分(MPPI)制御のようなサンプリングベースの手法は、確率的ロールアウトによって代替案を提供しますが、加算的ペナルティによって安全性を強制することは、本質的に脆弱です。つまり、形式的な制約充足の保証が提供されないからです。私たちは、COSMIK-MPPIと呼ばれる衝突回避の枠組みを提案します。これは、MPPIと、人の運動推定のためのRT-COSMIKツールボックス、および「Constraints-as-Terminations(制約を終端として扱う)」の転写を組み合わせることで構成されます。ここでは、制約違反を終端事象として扱うことで安全性を強制し、大きなペナルティ項や明示的な人の運動予測に依存しません。提案手法は、シミュレーションおよび実機のマニピュレータアームにおいて、最先端のGB-MPCと標準的なMPPIに対して評価されます。その結果、COSMIK-MPPIは計算時間を一定(22 ms)に保ちながら課題成功率100%を達成し、GB-MPCを大きく上回ることが示されました。シミュレーション上の成立不能な状況では、COSMIK-MPPIは標準的なMPPIとは対照的に、常に衝突のない軌道を生成します。これらの性質により、手頃なマーカレスの人間運動推定器を用いて共有作業空間における複雑な実世界のヒューマンロボット協調タスクを安全に実行でき、予測に基づく衝突回避として堅牢で、適合的で、実用的な解決策を実証しました(https://exquisite-parfait-ffa925.netlify.app で紹介された結果をご参照ください)

COSMIK-MPPI:近接する動的な人間環境における衝突回避への、制約付きモデル予測制御のスケーリング | AI Navigate