RopeDreamer:柔軟で変形可能な直線状物体のダイナミクスのための運動学的リカレント・状態空間モデル

arXiv cs.RO / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、接触が多い複雑なロボット操作における変形可能な直線状物体(DLO)の挙動を予測するための潜在ダイナミクスモデル「RopeDreamer」を提案している。
  • これは、リカレント状態空間モデルと、クォータニオンに基づく運動学チェーン表現を組み合わせることで、リンク長の不変などの物理的妥当性と、運動を多様体上に拘束する性質を強制する。
  • デュアルデコーダ設計により、状態の再構成と将来状態の予測を分離し、潜在空間が「観測への当てはめ」ではなく変形の物理を学ぶよう誘導している。
  • 自己交差を含む大規模なシミュレーションのピック&プレース軌道で評価した結果、50ステップ先までのオープンループ予測誤差が最先端ベースライン比で40.52%低減された。
  • さらに推論時間を31.17%削減し、多重交差の状況でも位相整合性をより良く保つことで、長期的な操作計画に向けた構成要素になり得ることを示している。

要旨: 可変線形物体(Deformable Linear Objects: DLO)のロボットによる操作は、柔軟構造の高次元かつ非線形なダイナミクス、ならびに接触が豊富なタスク中にトポロジカルな完全性を維持することの難しさにより、基本的な課題となっています。近年のデータ駆動型手法では、ダイナミクスのモデリングに反復型ニューラルネットワーク(Recurrent Neural Networks)やグラフニューラルネットワーク(Graph Neural Networks)が用いられてきましたが、多くの場合、自身との交差(self-intersections)や、絡まり(tangling)やリンクの伸張(link stretching)のような非物理的な変形に対処するのが困難です。本論文では、反復型状態空間モデル(Recurrent State Space Model)と四元数(Quaternionic)によるキネマティックチェーン表現を組み合わせた潜在ダイナミクスの枠組みを提案し、DLO状態の頑健で長期的な予測を可能にします。DLOを独立したデカルト位置としてではなく、相対回転(四元数)の系列として符号化することで、リンク長の不変性を保持する、物理的に妥当な多様体へモデルを本質的に拘束します。さらに、状態の再構成と将来状態の予測を切り離すデュアルデコーダ構成を導入し、潜在空間が変形の背後にある物理を捉えることを強制します。提案手法は、自身との交差を含む複雑なピッキング・アンド・プレース軌道の大規模なシミュレーションデータセットで評価します。その結果、本モデルは最先端のベースラインと比べて、50ステップの予測ホライズンにおけるオープンループ予測誤差を40.52%削減し、推論時間も31.17%短縮できることを示しました。さらに、複数の交差がある状況においても、トポロジカル整合性をより高い水準で維持しており、長期的な操作計画における合成的なプリミティブとして有効であることが証明されました。