現実時間での自律への「ゼロから」:構造化されていない環境におけるダイナミクスのオンライン適応

arXiv cs.RO / 2026/4/22

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • この論文は、構造化されていない環境で、突然のダイナミクス変化が起こる状況でも、自律ロボットが数秒以内に安全な制御へ到達するための適応を扱います。
  • 関数エンコーダと再帰的最小二乗法(RLS)を組み合わせ、ストリーミングのオドメトリからエンコーダ係数を潜在状態として逐次更新する手法を提案しています。
  • 勾配に基づく内側ループの更新を避けることで、係数推定を定数時間で実行でき、数秒分のデータだけで適応可能にしています。
  • Van der Polシステム、Unityによる高精度オフロード航法シミュレータ、さらにClearpath Jackalロボット(アイスリンクでの難条件を含む)で評価し、静的手法やメタ学習との比較でモデル精度と計画性能が向上したことを示します。
  • これにより、氷上へ移行するような急な地形遷移の際でも下流のプランナが改善され、衝突が減少することを報告しています。

Abstract

自律ロボットは、非構造化環境で動作するために、事前知識ゼロの状態から数秒以内に安全な制御へ到達しなければなりません。氷への突然の遷移のような急激な地形変化は、モデルがリアルタイムに適応できない限り、プランナーを不安定化させる可能性のあるダイナミクスの変化を引き起こします。本論文では、関数エンコーダと再帰的最小二乗法を組み合わせたオンライン適応手法を提案します。この手法では、関数エンコーダの係数を潜在状態として扱い、ストリーミングされるオドメトリから更新します。これにより、勾配に基づく内側ループ更新を行わずに、係数推定を一定時間で実現し、数秒分のデータだけから適応を可能にします。提案手法を、アルゴリズム挙動を示すためにVan der Pol系で評価し、高精度なオフロードナビゲーションのためのUnityシミュレータで、さらにClearpath Jackalロボットでも評価します。そこでは、ローカルのアイスリンク上の困難な地形を含みます。これらの設定すべてにおいて、本手法はモデル精度と下流のプランニングを改善し、静的およびメタラーニングのベースラインと比べて衝突を減らします。