Visual-RRT：微分可能レンダリングによる視覚ゴールへの経路探索

arXiv cs.RO / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

本論文は、目標が数値の関節角ではなく画像や動画といった視覚観測として与えられる場合に対応する、視覚ゴール型の運動計画手法Visual-RRT（vRRT）を提案する。
vRRTは、Rapidly-exploring Random Trees（RRT）によるサンプリングベースの探索と、微分可能なロボットレンダリングによる勾配ベースの活用（exploitation）を統合する。
さらに、探索を進める際に視覚的に有望な領域を状況に応じて優先するフロンティアベースの探索・活用戦略を提案する。
また、慣性勾配ツリー拡張として、枝ごとに最適化状態を引き継いで勾配活用の整合性（運動量のような挙動）を保つ仕組みも示す。
Franka、UR5e、Fetchなど複数のロボットで、シミュレーションおよび実機の両方で有効であることを実験により示し、コードも公開している。

Abstract

急速に探索するランダム木（RRT）は、その頑健性と理論的保証により、ロボットの運動計画に広く採用されてきました。しかし、既存のRRTベースのプランナーでは、数値の関節角として明示的に指定された目標姿勢が必要です。一方で、多くの実運用では、画像やデモンストレーション動画のような視覚観測を通じて目標が提示され、精密な目標姿勢が利用できないことがあります。本論文では、微分可能なロボットレンダリングに基づく勾配ベースの活用と、RRTからのサンプリングに基づく探索を統合することで、視覚ゴール計画を可能にする運動プランナー「visual-RRT（vRRT）」を提案します。さらに、(i) 視覚的に有望な探索領域を適応的に優先する、フロンティアベースの探索・活用戦略、ならびに (ii) 慣性（慣性に基づく）勾配ツリー拡張を導入し、ツリーの分岐間で最適化状態を引き継ぐことで、運動量整合的な勾配活用を継承します。Franka、UR5e、Fetch を含むさまざまなロボット・マニピュレータに対する大規模な実験により、vRRTがシミュレーション環境および実環境の両方で効果的な視覚ゴール計画を実現し、サンプリングベースの計画と、視覚中心のロボット応用とのギャップを埋めることを示します。コードは https://sgvr.kaist.ac.kr/Visual-RRT で公開されています。