中心質量(CoM)再構成による非ホロノミック(アンダーカクチュエーテッド)ブリンプのためのバイレベル強化学習制御
arXiv cs.RO / 2026/5/5
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、2つのスラスタと可動式の内部スライダーというコンパクトな構成を用いた中心質量(CoM)再構成により、アンダーカクチュエーテッド・ブリンプの目標追従制御を扱います。
- この設計はエネルギー効率とペイロード能力の向上を狙う一方で、CoMダイナミクスと機体運動の間に強い非線形結合と大きなアンダーカクチュエーションを生むことを示しています。
- これらの課題に対し、CoMの計画を担う外側ポリシー(タスクレベル)と、参照追従のための推力生成を担う内側ポリシー(制御レベル)を明示的に分離するバイレベル強化学習フレームワークを提案しています。
- 学習の安定化のため、2段階の学習戦略と、バイレベル過程に対する収束解析を導入しています。
- シミュレーションと実機実験をあわせ、27ゴールの評価セットで、固定CoMのベースラインやPID制御よりも高い追従精度・頑健性を示し、シムツーリアルの移植性も信頼できることを報告しています。



