予測可能な到達可能性に基づく未知の非線形ダイナミクス下での階層的モーション計画と制御

arXiv cs.RO / 2026/4/2

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、限られた事前システム知識のもとで、未知の非線形ダイナミクスに従って行動する自律エージェントのための、階層的なモーション計画・制御フレームワークを提示する。
それらの未知ダイナミクスを、エージェントが対応するポリトープ領域に入った後に局所的なアフィン・ダイナミクスを同定することで、オンライン学習した区分的アフィン（PWA）モデルで近似する。
計算を扱いやすくするために、タスクに関連する領域のみを精緻化する非一様な適応状態空間分割を用い、その分割上に抽象化した有向重み付きグラフを構築する。
本手法は、（緩和した）到達可能性理論と予測的到達可能性条件を用いて、どのグラフ辺が存在するかを認証し、認証された辺には証明可能な到達までの時間（time-to-reach）に対応する重みを、確実でない辺には情報理論的な重みを割り当てることで、探索と活用のバランスを取る。
シミュレーションにより、有形式の到達可能性保証を維持しつつ、有効な探索・活用のトレードオフが実現できることを示す。特に、古典的条件の成立が難しいアンダーアクチュエーテッド（非駆動）系に対しても同様の保証が得られることを報告する。

概要: 未知の非線形ダイナミクスのもとでの自律的な運動計画では、目標へ向かって移動しながら、システム特性を学習する必要があります。本研究では、限られた事前のシステム知識でオンライン運動合成を可能にする階層的な計画・制御フレームワークを開発します。状態空間をポリトープ（多面体）に分割し、未知の非線形システムを区分的にアフィン（PWA）モデルで近似します。局所のアフィンモデルは、エージェントが対応するポリトープに入った時点で同定されます。計算複雑性を抑えるために、タスクに関連する領域でのみ分割を精緻化する非一様の適応的状態空間分割戦略を導入します。得られたPWAシステムは有向重み付きグラフとして抽象化され、その辺（エッジ）の存在は到達制御理論および予測到達可能性条件を用いて漸次検証されます。認定された辺には、証明可能な「到達までの時間（time-to-reach）」の上界を重みとして付与し、確実でない辺には探索を導く情報理論的な重みを割り当てます。新しいデータが利用可能になるにつれてグラフはオンラインで更新され、高レベルの計画はグラフ探索によって行い、低レベルのアフィン状態フィードバック制御器は計画を実行するために合成します。さらに、古典的な到達制御理論の条件は、非駆動（アンダアクチュエーテッド）設定では満たすことが難しいことが多いです。そのため、そのようなシステムにも本フレームワークを拡張するために、緩和された到達可能性条件を導入します。シミュレーションにより、形式的な到達可能性の保証付きで、探索と活用の効果的なトレードオフが示されます。