KernelSOSによる接触を伴う操作のためのグローバル・サンプリングベース軌道最適化

arXiv cs.RO / 2026/5/1

📰 ニュースModels & Research

要点

  • 本論文は、接触を伴う操作のためにグローバルな探索と局所的な改善を統合するサンプリングベースの軌道最適化フレームワーク「Global-MPPI」を提案する。
  • 解の探索空間における全体的に有望な領域を特定するために、カーネル和の平方和(kernel sum-of-squares)最適化を用い、従来手法で起こりがちな局所解への収束問題を抑える。
  • 接触操作に特有の非滑らかなハイブリッド接触ダイナミクスに対応するため、log-sum-expによる平滑化を使った段階的非凸化戦略を導入し、滑らかな代理目的から元の非滑らかな目的へ段階的に移行する。
  • さらに、モデル予測パス積分(MPPI)を用いて解を局所的に洗練する。
  • PushTや巧緻な手内操作などの高次元・長時間ホライズンのタスクで、ベースラインより収束が速く最終コストが低いことを実験で示し、頑健な性能を報告している。

Abstract

接触に富む操作は、その高い次元性、長い時間的地平(ホライズン)を要すること、そして接触のハイブリッドなダイナミクスの存在により、困難です。この種の問題に対しては、サンプリングベースの手法が一般的なアプローチとして注目されていますが、グローバルな探索のための明示的な仕組みがない場合、質の悪い局所最小値へ収束してしまう傾向があります。本論文では、グローバル探索と局所的な精密化を統合した統一的な軌道最適化フレームワークであるGlobal-MPPIを提案します。グローバルレベルでは、解空間における大域的に有望な領域を特定するために、カーネル和の二乗(kernel sum-of-squares)による最適化を活用します。接触に富む操作に固有の非滑らかな地形に対して信頼性の高い性能を可能にするために、log-sum-exp の平滑化に基づく「段階的な非凸性(graduated non-convexity)」戦略を導入し、最適化の地形を、平滑化された代理目的から元の非滑らかな目的へと移行させます。最後に、モデル予測型パス積分法を用いて局所的に解を洗練(精密化)します。PushTタスクや器用な手内操作(dexterous in-hand manipulation)を含む、高次元で長時間地平の接触に富むタスクにおいてGlobal-MPPIを評価します。実験結果は、本手法が高品質な解を頑健に発見でき、既存のベースライン手法と比べてより速い収束と最終コストの低下を達成することを示しています。