Lyapunov安定なニューラル制御に対する分岐限定法(Branch-and-Bound)による認証付きトレーニング

arXiv cs.RO / 2026/4/7

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、指定された領域(ROA: region-of-attraction)にわたって検証可能なLyapunov漸近安定性を満たすニューラル制御器を学習するための、認証付きトレーニング手法CT-BaBを提示する。
  • トレーニング中の検証コストを無視する先行研究の反例生成に基づく手法とは異なり、CT-BaBは、トレーニング時の目的とテスト時の境界計算とのギャップを縮めるために、認証付き境界を明示的に最適化する。
  • CT-BaBは、トレーニング時に分岐限定法を用いることで動的なデータセットを維持し、難しい入力部分領域を適応的に分割して認証付き境界を締め付けることで、最適化を容易にする。
  • トレーニング中に作られた部分領域の分割は、テスト時の検証を加速するために再利用される。これにより、トレーニングを踏まえつつ検証効率の高い評価が可能になる。
  • 2Dクアッドロトールの出力フィードバックベンチマークでの実験により、CT-BaBは、従来のCEGISベースラインに対して検証時間を11倍超削減しつつ、より大きなROA(報告値として164倍)を達成することが示されている。

Abstract

本稿では、作用域(ROA)の内部においてリャプノフ漸近安定性条件を確実に満たすことを証明できる、検証可能なリャプノフ安定なニューラル制御器を学習する問題を研究する。訓練中に検証の計算を考慮せず、反例に導かれる訓練を採用していた先行研究とは異なり、我々は、新しい認証付き訓練フレームワークである Certified Training with Branch-and-Bound(CT-BaB)を提案する。CT-BaB は、認証付き境界を最適化することで、訓練と、認証付き境界も計算するテスト時の検証との間に生じる不一致を低減する。入力の関心領域全体に対して比較的広い保証を達成するために、訓練時の BaB 手法を提案する。この手法は動的な訓練データセットを維持し、難しい入力部分領域を適応的により小さい領域へ分割することで、認証付き境界を引き締め、訓練を容易にする。一方で、訓練時の BaB によって作られた部分領域は、より効率的な「訓練を踏まえた」検証のために、テスト時の検証にも情報を提供する。我々は、CT-BaB が検証しやすいモデルを生み出し、より大きな ROA に対してより強力な検証可能性の保証を達成しつつ、テスト時により効率よく検証できることを示す。実験した最大の出力フィードバック 2D クアドロトル系において、CT-BaB は、Counterexample Guided Inductive Synthesis(CEGIS)を用いた従来の最先端ベースラインに比べて検証時間を 11 倍以上(11X)短縮し、また 164 倍大きい ROA を達成する。コードは https://github.com/shizhouxing/CT-BaB で公開されている。