中心質量(CoM)再構成による非ホロノミック(アンダーカクチュエーテッド)ブリンプのためのバイレベル強化学習制御

arXiv cs.RO / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、2つのスラスタと可動式の内部スライダーというコンパクトな構成を用いた中心質量(CoM)再構成により、アンダーカクチュエーテッド・ブリンプの目標追従制御を扱います。
  • この設計はエネルギー効率とペイロード能力の向上を狙う一方で、CoMダイナミクスと機体運動の間に強い非線形結合と大きなアンダーカクチュエーションを生むことを示しています。
  • これらの課題に対し、CoMの計画を担う外側ポリシー(タスクレベル)と、参照追従のための推力生成を担う内側ポリシー(制御レベル)を明示的に分離するバイレベル強化学習フレームワークを提案しています。
  • 学習の安定化のため、2段階の学習戦略と、バイレベル過程に対する収束解析を導入しています。
  • シミュレーションと実機実験をあわせ、27ゴールの評価セットで、固定CoMのベースラインやPID制御よりも高い追従精度・頑健性を示し、シムツーリアルの移植性も信頼できることを報告しています。