Tac2Real：オンライン強化学習およびゼロショットでの現実世界展開のための信頼性の高いGPUビジュオタクタイル・シミュレーション

arXiv cs.RO / 2026/3/31

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

Tac2Realは、インタラクティブなマーカ変位場生成を可能にし、効率的なオンライン強化学習を実現することを目的とした軽量なビジュオタクタイル・シミュレーション・フレームワークとして導入される。
本システムは、PNCG-IPC接触シミュレーション手法と、多ノード・マルチGPUの並列アーキテクチャを組み合わせることで、物理忠実度と計算効率の両立を図り、リアルタイム処理レートを可能にする。
ゼロショット転送時の信頼性を高めるため、構造化されたドメインギャップと確率的なドメインギャップの両方を低減するTacAlignアプローチが提案される。
接触が多いペグ挿入タスクで評価を行い、現実世界での展開において高いゼロショット成功率が報告されており、頑健性が示される。

要旨：触覚-視覚（visuotactile）センサーは、接触が豊富なロボットマニピュレーション課題に不可欠である。しかし、特にオンライン強化学習（RL）において、シミュレーション上で触覚フィードバックを用いたポリシー学習は、依然として重要な課題である。これは、物理の忠実度と計算効率の微妙なバランスを要求するためである。この課題に対処するため、我々は効率的なオンラインRL学習を可能にする軽量な触覚-視覚シミュレーションフレームワーク Tac2Real を提案する。Tac2Real は、前処理付き非線形共役勾配（Preconditioned Nonlinear Conjugate Gradient）による漸進的ポテンシャル接触（Incremental Potential Contact; PNCG-IPC）手法を、多ノード・多GPUの高スループットな並列シミュレーション・アーキテクチャと統合し、インタラクティブな速度でマーカ変位場を生成できる。一方で、我々はドメインギャップの構造的要因と確率的要因の双方を狭め、確実なゼロショットの sim-to-real 転移を実現するための体系的アプローチ TacAlign も提案する。さらに、接触が豊富なペグ挿入課題において Tac2Real を評価する。ゼロショット転移の結果は、現実環境において高い成功率を達成し、我々のフレームワークの有効性と頑健性を検証する。プロジェクトページは以下である：https://ningyurichard.github.io/tac2real-project-page/