連続時間の残差学習による車両のロバスト経路追従：ICODE-MPPIアプローチ

arXiv cs.RO / 2026/5/6

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、車両の公称ダイナミクスの不確かさに起因するMPPI（Model Predictive Path Integral）制御の性能ボトルネックに対処するロバスト版としてICODE-MPPIを提案する。
Input Concomitant Neural Ordinary Differential Equations（ICODE）を用いて未モデルの残差ダイナミクスを学習し、その際に物理的整合性と時間的連続性をMPPIの予測ホライズン全体で維持する。
高精度シミュレーションの結果として、持続的な外乱下で標準MPPIに比べて横方向の追従誤差を最大69%削減できることを示している。
さらに、制御のチャタリングを抑制し、より滑らかな操舵コマンドと優れたロバスト性能につながると報告する。
離散時間の残差学習と異なり、連続時間のICODEモデリングがロールアウト中の時間に対してダイナミクス整合性をより保ちやすい点が重要な差別化ポイントとして強調されている。

Abstract

モデル予測経路積分（MPPI）制御は、非線形自律システムに対する強力なサンプリングベースの戦略である。しかし、その性能はしばしば公称ダイナミクスの忠実度によってボトルネック化される。そこで本研究では、未モデルの残差ダイナミクスを学習して補償するために、Input Concomitant Neural Ordinary Differential Equations（ICODE）を活用するロバストな枠組みICODE-MPPIを提案する。離散時間学習器とは異なり、ICODEはMPPIの予測ホライゾンにおいて、物理的整合性と時間的連続性を維持する。複雑な軌道に対する高忠実度シミュレーションにより、ICODE-MPPIは、標準的なMPPI制御と比較して、持続的外乱下で横方向追従誤差を最大69 7%削減できることを示す。さらに解析により、ICODE-MPPIが制御チャタリングを大幅に抑制し、より滑らかな操舵指令と優れたロバスト性能をもたらすことを確認した。