学習と制御のためのソフトな勾配を用いたハードコンタクトの微分可能シミュレーション

arXiv cs.RO / 2026/3/24

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、自己微分（オートマチック・ディファレンテーション）を備えたシミュレータを用いる場合に、不連続な接触力が勾配ベースのロボット学習および制御をどのように制限するかを扱う。
罰則ベースのアプローチ（例：接触解決のソフト化）では勾配を可能にできる一方で、「ハードコンタクト」領域では、剛性の高いソルバ設定やADによる不正確な勾配のために勾配が劣化することを見出す。
著者らは、ペナルティベースのシミュレーションと適応的な時間積分を結合することで、ハードコンタクトをより適切に扱い、勾配精度を改善するDiffMJXを提案する。
また、分離後に接触勾配が消失する問題に対し、Contact from Distance（CFD）を導入する。後退（バックワード）パスでストレートスルー推定を用いて、物理的妥当性を保ちつつ、分離前の情報量のある勾配を維持する。

Abstract

接触力はロボットのダイナミクスに不連続性を導入し、勾配ベースの最適化にシミュレータを用いることを大きく制限します。MuJoCoのようなペナルティベースのシミュレータでは、勾配計算を可能にするために接触解決を緩めます。しかし、硬い接触を現実的にシミュレートするには剛性の高いソルバ設定が必要であり、自動微分を用いるとシミュレータ勾配が誤ったものになります。逆に、非剛性（非stiff）な設定を使うと、シム・ツー・リアルのギャップが大幅に増大します。私たちは、なぜ硬い接触のもとで勾配が劣化するのかを特定するために、ペナルティベースのシミュレータを解析します。これらの洞察に基づき、適応的な時間積分とペナルティベースのシミュレーションを結合するDiffMJXを提案し、勾配精度を大幅に改善します。2つ目の課題は、物体が分離すると接触勾配が消失することです。これに対処するために、距離からの接触（CFD）を導入します。これは、ペナルティベースのシミュレーションとstraight-through推定を組み合わせたものです。CFDを後方パスにのみ適用することで、物理的なリアリズムを保ちながら、接触前の有益な勾配を得ます。

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

日経XTECH

機械学習・ディープラーニングにおける数学の必要性

日経XTECH

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

Santa Augmentcode Intent Ep.6

Dev.to

あなたのエージェントが別のエージェントを雇った。出力はゴミだった。金も消えた。

Dev.to

学習と制御のためのソフトな勾配を用いたハードコンタクトの微分可能シミュレーション

要点

Abstract

関連記事

人型ロボットは建設業で使えるか、建設RXコンソーシアム・村上会長に聞く

機械学習・ディープラーニングにおける数学の必要性

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

Santa Augmentcode Intent Ep.6

あなたのエージェントが別のエージェントを雇った。出力はゴミだった。金も消えた。

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer