冗長ロボットにおける離散計画と連続実行のブリッジング

arXiv cs.RO / 2026/4/3

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、7自由度（7-DoF）の冗長ロボットアームに対するボクセル格子強化学習プランナの一般的な失敗モードを扱う。具体的には、点ごとの数値的逆運動学（IK）実行により、ステップサイズのジッタ、関節の急激な遷移、特異点近傍での不安定化が生じる。
離散プランナの部分はそのまま維持しつつ、離散アクション表現（ステップ正規化26近傍のカーテシアンアクションに加え幾何学的なタイブレーク）と連続実行層の両方を安定化させる「ブリッジング」フレームワークを提案する。
実行においては、終端効果器位置を主要タスクとし、姿勢および関節センタリングの目的を零空間へ射影する、タスク優先付き減衰最小二乗逆運動学（TP-DLS）を提案する。
信頼領域クリッピングと関節速度制約を用いることで、この手法は7-DoFマニピュレータ上で結果を大幅に改善する。例えば、密なシーンでの計画成功率を約0.58から1.00へ引き上げ、経路長を約1.53 mから約1.10 mへ短縮し、終端効果器誤差を1 mm未満に抑え、ピーク関節加速度を1桁以上低減する。
全体として、離散計画の出力を、拘束付き・優先度ベースの連続IKと慎重に結合することで、強化学習によって生成されたロボット軌道の実世界における滑らかさと安定性を大きく改善できることを示している。

Abstract

ボクセル格子による強化学習は、その単純さと再現性から冗長マニピュレータの経路計画に広く採用されています。しかし、7自由度（7-DoF）アームに対する点ごとの数値逆運動学による直接実行では、ステップサイズのジッタ、急な関節遷移、そして特異配置の近傍での不安定性がしばしば生じます。本研究では、離散的な計画器自体を変更せずに、離散計画と連続実行の間をつなぐブリッジ（橋渡し）フレームワークを提案します。計画側では、不要な旋回を抑え、ステップサイズのオシレーションを解消するために、ステップ正規化した26近傍の直交座標（Cartesian）アクションと、幾何学的なタイブレーク（同順位の選択）メカニズムを導入します。実行側では、タスク優先の減衰付き最小二乗（TP-DLS）逆運動学レイヤを実装します。このレイヤでは、終端効果器の位置を主要タスクとして扱い、姿勢および関節の中心化（joint centering）を従属タスクとしてヌル空間に射影し、信頼領域クリッピングと関節速度制約を組み合わせます。ランダムな疎、中密度、高密度の環境における7自由度マニピュレータにおいて、このブリッジは密なシーンでの計画成功を約0.58から1.00へ引き上げ、代表的な経路長をおよそ1.53 mから1.10 mへ短縮します。また、終端効果器誤差を1 mm未満に保ったまま、ピーク関節加速度を1桁以上低減し、冗長マニピュレータに対するボクセルベース強化学習経路の連続実行品質を大幅に改善します。