ロボット動力学の生成的インコンテキスト・メタ学習のための拡散系列モデル

arXiv cs.LG / 2026/4/16

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ロボットのシステム同定を、順方向ダイナミクス予測に対するインコンテキスト・メタ学習として位置づけ、分布シフトへの頑健性と、モデルベース制御のためのリアルタイム実行可能性の両方を目標とする。
  • Transformerベースの決定論的なメタモデルのベースラインと、拡散ベースの生成アプローチ2種類を比較する。これには、インペインティング拡散(Diffuser)や、制御入力から将来の観測を生成する条件付き拡散モデルが含まれる。
  • 大規模なランダム化シミュレーションでの実験により、分布内および分布外の両条件での性能を評価し、制御ループにとって重要となる計算上のトレードオフを分析する。
  • 結果として、拡散モデルは分布シフト下での頑健性を大幅に改善し、報告された実験ではインペインティング拡散が総合的に最も高い性能を示す。
  • ウォームスタート付きの拡散サンプリングがリアルタイム制約を満たすことが示されており、生成的メタモデルがロボットの動力学モデリングにおける実用的で頑健な構成要素となり得るという考えを支持している。

Abstract

ロボットのダイナミクスを正確にモデル化することはモデルベース制御に不可欠ですが、分布シフトやリアルタイム制約の下では依然として困難です。本研究では、システム同定をインコンテキスト・メタ学習の問題として定式化し、順方向ダイナミクス予測のために決定論的および生成的な系列モデルを比較します。強力な決定論的ベースラインとしてTransformerベースのメタモデルを採用し、この設定に対して補完的な拡散ベースの2つのアプローチを導入します: (i)inpainting diffusion(Diffuser)。これは入力と観測の同時分布を学習します。および(ii)条件付き拡散モデル(CNNおよびTransformer)。これは制御入力に条件付けられて将来の観測を生成します。大規模なランダム化シミュレーションを通じて、分布内および分布外の状況における性能、ならびに制御に関連する計算上のトレードオフを解析します。拡散モデルが分布シフト下で頑健性を大幅に向上させることを示し、inpainting diffusionが本実験において最良の性能を達成します。最後に、ウォームスタート付きサンプリングにより拡散モデルがリアルタイム制約の範囲で動作できることを示し、制御アプリケーションにおいて実行可能であることを明らかにします。これらの結果は、ロボティクスにおける頑健なシステム同定のための有望な方向性として、生成的メタモデルを示唆しています。