多峰性不確実性下における頑健な器用把持のための変分ニューラルな信念パラメータ化

arXiv cs.RO / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、接触のばらつき・感覚(センシング)の不確実性・外乱により把持動作が確率的になる問題を扱い、平均的な品質目的が不利な接触実現では失敗しやすい点を指摘する。
  • 潜在する接触パラメータと物体姿勢に対する変分推論に基づき、微分可能なガウス混合で信念(ベリーフ)を表現する新しいリスク感度型手法を提案する。
  • Gumbel-Softmaxによる成分選択とロケーション=スケールの再パラメータ化により、確率的サンプルを信念パラメータの滑らかな関数として扱い、微分可能なCVaR代理で尾部頑健性を直接最適化できるようにしている。
  • シミュレーションでは、接触パラメータ不確実性や外部の力摂動の下で頑健な把持成功が向上し、粒子フィルタ型モデル予測制御に比べて計画時間をおよそ1桁削減できることを示す。
  • シリアルリンクのロボットアームと多指ハンドで、物体姿勢不確実性下の把持・持ち上げにおいて、ガウス基準よりも制御のステップ数と実時間が少なく、かつ触覚に基づく把持品質の代理指標が高い結果と、リスク校正誤差(平均絶対校正誤差0.14未満)をより正確に達成することを報告する。

Abstract

接触のばらつき、センシングの不確実性、および外乱により、把持の実行は確率的になります。期待品質(expected-quality)の目的関数は末端(tail)の結果を無視し、しばしば不利な接触実現において失敗する把持を選択します。リスクに敏感なPOMDPはこの失敗モードに対処しますが、多くはスケールしにくいパーティクルフィルタの信念を用い、勾配ベースの最適化を妨げ、高分散の近似によって条件付き価値・対リスク(Conditional Value-at-Risk; CVaR)を推定しています。そこで我々は、把持獲得を潜在の接触パラメータと物体姿勢に関する変分推論として定式化し、信念を微分可能なガウス混合分布で表現します。ガンベル-ソフトマックスによる成分選択と、ロケーション・スケールの再パラメータ化を用いることで、サンプルを信念パラメータの滑らかな関数として表し、末端頑健性を直接最適化するために、微分可能なCVaRサロゲートを通じた経路依存(pathwise)勾配を可能にします。シミュレーションでは、我々の変分ニューラル信念は、接触パラメータの不確実性と外生的な力の擾乱に対して、頑健な把持成功を改善しつつ、パーティクルフィルタのモデル予測制御(model-predictive control)と比べて計画時間をおよそ1桁分短縮します。多指ハンドを備えた直列リンクのロボットアーム上で、物体姿勢の不確実性に対して、ガウス基準(Gaussian baseline)に比べて把持・持ち上げの成功を検証します。両手法ともテストした擾乱では成功しますが、我々のコントローラは、より少ないステップ数およびより短いウォールクロック時間で終了し、かつより高い触覚に基づく把持品質の代理指標を達成します。学習した信念はまた、リスクのキャリブレーションをより正確に行い、テストしたシミュレーション条件の範囲で平均絶対キャリブレーション誤差を0.14未満に保ちます。これは、クロスエントロピー法プランナーに対して0.58であるのと比べて優れています。