要旨: 四足歩行のロコマニピュレーションは一般に、視覚認識と固有受容感覚に基づいて構築されます。しかし、接触が豊富な操作を確実に行うことは依然として困難です。視覚と固有受容感覚だけでは、不確実で変化し続ける環境との相互作用を解決できません。触覚センシングは直接的な接触の観測を提供しますが、四足歩行のロコマニピュレーションに対する、触覚に配慮した学習のためのスケーラブルな枠組みはまだ十分に研究されていません。本論文では、階層構造を備えた触覚に配慮したロコマニピュレーションのポリシー学習パイプラインを提案します。提案手法には2つの重要な構成要素があります。第一に、実世界の人間によるデモンストレーションを活用して、触覚条件付きの視触覚ハイレベルポリシーを学習します。このポリシーは、操作のためのエンドエフェクタ軌道だけでなく、接触が時間とともにどのように発達すべきかを特徴づける、変化する触覚相互作用の手がかりも予測します。第二に、シミュレーション上で大規模な強化学習を行い、多様な指令軌道および触覚相互作用の手がかりを追跡する触覚に配慮した全身制御ポリシーを学習し、それをゼロショットで現実世界に転移します。これら2つの要素により、接触が豊富なシナリオにおいて、移動と操作を協調して実行できるようになります。提案システムは、現実世界の接触が豊富なタスク、すなわち、挿入を伴うハンド内の姿勢変更、バルブの締め付け、繊細な物体操作で評価します。視覚のみおよび視触覚のベースラインと比べて、本手法はこれらのタスク全体で平均28.54%性能を向上させます。
触覚対応型 4足歩行のロコマニピュレーション・ポリシー学習
arXiv cs.RO / 2026/5/1
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、4足歩行のロコマニピュレーションにおける重要な課題として、視覚と固有受容感覚だけでは環境との不確実で変化する接触相互作用を扱うのが難しい点を扱い、触覚による直接的な接触観測の有効性を示しています。
- 階層構造を持つ触覚対応型のポリシー学習パイプラインを提案し、まず実環境での人によるデモを用いて、触覚条件付きのビジュオタクタイル高レベル方策を学習します。
- 高レベル方策は、操作における手先(エンドエフェクタ)の軌道だけでなく、時間とともに変化する接触の相互作用キュー(どのように接触が発達すべきかを示す信号)も同時に予測します。
- さらに、大規模強化学習をシミュレーション上で実施し、多様な指令軌道と触覚キューを追跡できる触覚対応型の全身制御方策を学習し、現実世界へゼロショット転移します。
- 実環境の接触が多いタスク(挿入を伴うハンド内向き変更、バルブの締め付け、繊細な物体操作)で評価した結果、視覚のみおよびビジュオタクタイル基線に比べて平均28.54%の性能向上が得られました。




