冗長ロボットにおける離散計画と連続実行のブリッジング
arXiv cs.RO / 2026/4/3
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、7自由度(7-DoF)の冗長ロボットアームに対するボクセル格子強化学習プランナの一般的な失敗モードを扱う。具体的には、点ごとの数値的逆運動学(IK)実行により、ステップサイズのジッタ、関節の急激な遷移、特異点近傍での不安定化が生じる。
- 離散プランナの部分はそのまま維持しつつ、離散アクション表現(ステップ正規化26近傍のカーテシアンアクションに加え幾何学的なタイブレーク)と連続実行層の両方を安定化させる「ブリッジング」フレームワークを提案する。
- 実行においては、終端効果器位置を主要タスクとし、姿勢および関節センタリングの目的を零空間へ射影する、タスク優先付き減衰最小二乗逆運動学(TP-DLS)を提案する。
- 信頼領域クリッピングと関節速度制約を用いることで、この手法は7-DoFマニピュレータ上で結果を大幅に改善する。例えば、密なシーンでの計画成功率を約0.58から1.00へ引き上げ、経路長を約1.53 mから約1.10 mへ短縮し、終端効果器誤差を1 mm未満に抑え、ピーク関節加速度を1桁以上低減する。
- 全体として、離散計画の出力を、拘束付き・優先度ベースの連続IKと慎重に結合することで、強化学習によって生成されたロボット軌道の実世界における滑らかさと安定性を大きく改善できることを示している。




