制御リャプノフ関数ガイド付き強化学習における制御安定性
arXiv cs.RO / 2026/5/5
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ヒューマノイドの歩行に用いられる強化学習(RL)で生じる主要な課題として、CLF-RLに基づく制御ポリシーの安定性分析を提示します。
- RL問題を最適制御問題として捉え、連続時間・離散時間の両方で指数安定性を証明します。
- 安定性の理論は、制御リャプノフ関数(CLF)の基本的な報酬項だけでなく、実務で追加されがちな補助的な報酬項にも適用されます。
- 数値実験により、理論的な境界(バウンド)をダブルインテグレータやカートポールといったベンチマーク系で検証します。
- さらに歩行ヒューマノイドロボットでCLF誘導の報酬を実装し、安定した周期軌道(安定周期運動)を生成できることを示します。




