リファレンス・アシスト学習による腱駆動コンティニュアムロボットの精密トラッキング制御方策

arXiv cs.RO / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 腱駆動コンティニュアムロボット(TDCR)は非線形で履歴依存・非マルコフ的なダイナミクスを持つため、従来のヤコビアン系制御ではヒステリシス起因の振動や追従の難しさが生じます。
  • 本論文は、参照(reference)を補強したオフライン学習フレームワークにより、TDCRの6自由度(6-DOF)追従制御を高精度化する手法を提案しています。
  • 両者の架け橋として微分可能なRNNベースのダイナミクス代理モデル(surrogate)を用い、勾配計算を可能にしつつ「補強された参照分布」に基づいて制御ポリシーを最適化します。
  • 多段階のデータ拡張(確率的バイアス、調和的摂動、ランダムウォーク)により、追加のハードウェア相互作用なしで多様な追従誤差の回復メカニズムをポリシーに学習させます。
  • 3セクションTDCRの実験では、非補強ベースラインに比べ平均位置誤差を50.9%削減し、ヤコビアン系手法に対して速度範囲を通じて精度と安定性の両面で優れた性能を示しました。

Abstract

腱駆動連続体ロボット(Tendon-Driven Continuum Robots, TDCRs)は、その高度に非線形で経路依存的なダイナミクス、および非マルコフ特性によって、制御上の大きな課題を抱えています。従来のヤコビアンに基づく制御器は、ヒステリシスによって誘発される振動にしばしば苦戦します。一方で、従来型の学習ベース手法では、分布外(out-of-distribution)の軌道に対する汎化性能が不十分です。本論文では、TDCRの正確な6自由度(6-DOF)追従制御のための参照(reference)を拡張したオフライン学習フレームワークを提案します。微分可能なRNNベースのダイナミクス代替モデルを勾配ブリッジとして活用し、拡張した参照分布により制御方策を最適化します。この多段階(multi-scale)の拡張手法は、確率的バイアス、調和的摂動、ランダムウォークを組み込み、追加のハードウェア相互作用なしに、方策が多様な追従誤差の回復メカニズムを内在化することを促します。3セクション構成のTDCRプラットフォームにおける実験結果から、提案方策は、拡張を行わないベースラインと比較して平均位置誤差を50.9 ext%削減し、さらに、さまざまな速度において精度と安定性の両面でヤコビアンベース手法を大きく上回ることが示されました。