学習ベースの経路追従のためのモデル予測経路積分PID制御

arXiv cs.RO / 2026/4/1

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、各制御ステップでMPPIによりPIDゲインを最適化する学習ベースのMPPI--PID制御手法を提案し、全制御入力系列に対する高次元の最適化を回避する。
低次元のゲイン空間で最適化することで、サンプル効率が向上し、直接MPPIの入力系列サンプリングよりも滑らかで連続的な制御入力が得られる。
著者らは、MPPIとMPPI--PIDを結び付ける情報理論的観点を含む理論解析を提示し、最適化の次元数がサンプル効率に与える影響、ならびにPID構造が入力の連続性に及ぼす影響に関する結果を示す。
残差学習ダイナミクスモデル（物理モデル＋ニューラルネットワーク）を用いたミニフォークリフトの学習ベース経路追従、および実データに基づくシステム同定の実験では、固定ゲインPIDよりも良好な追従が得られ、入力増分を削減しつつ、従来のMPPIと同程度の追従性能が示される。
本手法は、はるかに少ないサンプル数で強い性能を維持できることを示しており、サンプリング予算が限られるリアルタイム設定でより実用的になり得ることを示唆している。

Abstract

従来の比例--積分--微分（PID）制御は産業用途で広く用いられていますが、より高い性能を達成することが動機となり、モデル予測制御（MPC）の採用が促されることが多いです。リアルタイム最適化には勾配ベース手法が標準ですが、近年ではサンプリングベースのアプローチにも注目が集まっています。特に、モデル予測経路積分（MPPI）制御は勾配を使わない最適化を可能にし、微分不可能なモデルや目的関数にも対応できます。しかし、制御入力系列を直接サンプリングすると、入力が不連続になり得ることに加え、予測ホライズンに比例して最適化の次元数が増大します。本研究ではMPPI--PID制御を提案します。これは、各制御ステップでMPPIを適用してPIDゲインを最適化することで、高次元の入力系列の直接的な最適化を、低次元のゲイン空間の最適化に置き換えるものです。この定式化によりサンプル効率が向上し、PID構造によって入力がより滑らかになります。また、MPPIとMPPI--PIDを統一する情報理論的解釈、サンプル効率に対する最適化次元数の影響の分析、PID構造によって誘起される入力連続性の特徴付けといった理論的洞察も示します。提案手法は、物理モデルとニューラルネットワークを統合する残差学習ダイナミクスモデルを用いて、ミニフォークリフトの学習ベース経路追従により評価します。システム同定は実走行データで行います。数値的な経路追従実験では、MPPI--PIDが固定ゲインPIDと比較して追従性能を改善し、従来のMPPIと同等の性能を達成しつつ、入力増分を大幅に低減できることが示されます。さらに、提案手法は、かなり少ないサンプル数でも良好な性能を維持し、改善されたサンプル効率を実証します。

Show HN: 1ビット盆栽 — 最初の商用可能な1ビットLLM

Dev.to

詰まったときに自分でツールを書き起こせるAIエージェントを作った

Dev.to

エージェントの自己発見：AIエージェントが自分の財布を見つける方法

Dev.to

[P] フェデレーテッド・敵対的学習

Reddit r/MachineLearning

反転エラー：なぜ安全なAGIには「エナクティブなフロア」と「状態空間の可逆性」が必要なのか

Towards Data Science

学習ベースの経路追従のためのモデル予測経路積分PID制御

要点

Abstract

関連記事

Show HN: 1ビット盆栽 — 最初の商用可能な1ビットLLM

詰まったときに自分でツールを書き起こせるAIエージェントを作った

エージェントの自己発見：AIエージェントが自分の財布を見つける方法

[P] フェデレーテッド・敵対的学習

反転エラー：なぜ安全なAGIには「エナクティブなフロア」と「状態空間の可逆性」が必要なのか

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer