学習ベースの経路追従のためのモデル予測経路積分PID制御
arXiv cs.RO / 2026/4/1
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、各制御ステップでMPPIによりPIDゲインを最適化する学習ベースのMPPI--PID制御手法を提案し、全制御入力系列に対する高次元の最適化を回避する。
- 低次元のゲイン空間で最適化することで、サンプル効率が向上し、直接MPPIの入力系列サンプリングよりも滑らかで連続的な制御入力が得られる。
- 著者らは、MPPIとMPPI--PIDを結び付ける情報理論的観点を含む理論解析を提示し、最適化の次元数がサンプル効率に与える影響、ならびにPID構造が入力の連続性に及ぼす影響に関する結果を示す。
- 残差学習ダイナミクスモデル(物理モデル+ニューラルネットワーク)を用いたミニフォークリフトの学習ベース経路追従、および実データに基づくシステム同定の実験では、固定ゲインPIDよりも良好な追従が得られ、入力増分を削減しつつ、従来のMPPIと同程度の追従性能が示される。
- 本手法は、はるかに少ないサンプル数で強い性能を維持できることを示しており、サンプリング予算が限られるリアルタイム設定でより実用的になり得ることを示唆している。



