学習と制御のためのソフトな勾配を用いたハードコンタクトの微分可能シミュレーション

arXiv cs.RO / 2026/3/24

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、自己微分(オートマチック・ディファレンテーション)を備えたシミュレータを用いる場合に、不連続な接触力が勾配ベースのロボット学習および制御をどのように制限するかを扱う。
  • 罰則ベースのアプローチ(例:接触解決のソフト化)では勾配を可能にできる一方で、「ハードコンタクト」領域では、剛性の高いソルバ設定やADによる不正確な勾配のために勾配が劣化することを見出す。
  • 著者らは、ペナルティベースのシミュレーションと適応的な時間積分を結合することで、ハードコンタクトをより適切に扱い、勾配精度を改善するDiffMJXを提案する。
  • また、分離後に接触勾配が消失する問題に対し、Contact from Distance(CFD)を導入する。後退(バックワード)パスでストレートスルー推定を用いて、物理的妥当性を保ちつつ、分離前の情報量のある勾配を維持する。

Abstract

接触力はロボットのダイナミクスに不連続性を導入し、勾配ベースの最適化にシミュレータを用いることを大きく制限します。MuJoCoのようなペナルティベースのシミュレータでは、勾配計算を可能にするために接触解決を緩めます。しかし、硬い接触を現実的にシミュレートするには剛性の高いソルバ設定が必要であり、自動微分を用いるとシミュレータ勾配が誤ったものになります。逆に、非剛性(非stiff)な設定を使うと、シム・ツー・リアルのギャップが大幅に増大します。私たちは、なぜ硬い接触のもとで勾配が劣化するのかを特定するために、ペナルティベースのシミュレータを解析します。これらの洞察に基づき、適応的な時間積分とペナルティベースのシミュレーションを結合するDiffMJXを提案し、勾配精度を大幅に改善します。2つ目の課題は、物体が分離すると接触勾配が消失することです。これに対処するために、距離からの接触(CFD)を導入します。これは、ペナルティベースのシミュレーションとstraight-through推定を組み合わせたものです。CFDを後方パスにのみ適用することで、物理的なリアリズムを保ちながら、接触前の有益な勾配を得ます。