漂流モデルによるレシーディング・ホライゾン制御

arXiv cs.AI / 2026/4/7

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、システムダイナミクスが未知である状況における軌道最適化を扱う。学習済みのサロゲートモデルは軌道のシミュレーションに利用できず、利用可能なのは軌道に関するオフラインのデータセットのみである。
「Drifting MPC（漂流MPC）」を提案する。漂流する生成モデルとレシーディング・ホライゾン計画を組み合わせることで、データが支持する（データに整合した）条件付き軌道分布を学習しつつ、低コスト（最適）な計画にバイアスをかける。
著者らは、学習された分布を、コストの最適性とオフラインの事前分布への近さとの間で明示的にトレードオフを行う目的関数の「唯一の最適解」として特徴づける。
実験結果から、Drifting MPCは拡散ベースのベースラインよりも生成を高速化しつつ、漂流モデルに典型的な1ステップ推論の効率を保ちながら、ほぼ最適な軌道を生成できることが示される。

日経XTECH

日経XTECH

Dev.to

Reddit r/LocalLLaMA

Dev.to