ポート・ハミルトニアン系の共同学習と最適エネルギー形状制御

arXiv cs.AI / 2026/4/30

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、軌道データのみを用いてポート・ハミルトニアン(pH)系のエネルギー形状制御を設計するための、物理に基づいた学習フレームワークを提案しています。
  • pHシステムモデルと最適エネルギー・バランス・パッシビティ基盤の制御器(EB-PBC)を、交互最適化によって共同学習し、各反復で現行の制御方策に基づいて収集したデータでモデルを更新した後に制御器を再最適化します。
  • 学習されるダイナミクスモデルと制御器はいずれも、pH/EB-PBCの構造を埋め込むニューラルネットワークでパラメータ化され、エネルギー相互作用の観点で解釈可能性を保つことを狙っています。
  • 得られた閉ループ制御器は、本質的に受動的であり、安定性が理論的に保証される設計になっており、さらに散逸正則化によってエネルギー減衰を強く促してシミュレーションから実環境へのギャップに対する頑健性を高めます。
  • 平面およびねじれ振り子系に対する状態レギュレーションとスイングアップのタスクで、提案手法の有効性が検証されています。

Abstract

我々は、軌道データからポート・ハミルトニアン(pH)システムのエネルギー成形制御を行うための、物理情報に基づく学習フレームワークを開発します。提案手法は、方策を意識したデータ収集と交互最適化によって、pHシステムモデルと最適エネルギー整合パッシビティ基盤コントローラ(EB-PBC)を{共同学習}します。各反復において、システムモデルは現在の制御方策の下で収集された軌道データにより更新され、更新後のモデルに対してコントローラが再最適化されます。これらの2つの構成要素は、pH{ダイナミクス}およびEB-PBC構造を埋め込むニューラルネットワークによってパラメータ化され、エネルギー{相互作用}の観点での解釈可能性を保証します。学習されたコントローラは、閉ループ系を本質的にパッシブにし、かつ確実に安定であることを示せる(provably stable)ものにし、自然なポテンシャルを打ち消すことなく受動的なプラントのダイナミクスを活用します。減衰(散逸)正則化により、学習中の厳密なエネルギー減衰が強制され、その結果、sim-to-real(シミュレーションから実機)ギャップに対する頑健性が向上します。提案フレームワークは、平面およびねじれ振り子(torsional pendulum)システムに対する状態レギュレーションとスイングアップのタスクで検証されます。