AME-2:注意に基づくニューラルマップエンコーディングによる、アジャイルかつ汎用的な脚ロボット移動

arXiv cs.RO / 2026/3/25

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、障害物の隠蔽(occlusion)や足場が乏しい環境でも、知覚と制御の密な統合により俊敏かつ汎用的な脚ロボット移動を実現するためのAME-2を提案している。
  • AME-2は強化学習(RL)に、注意機構つきのニューラルマップエンコーダを組み込むことで、局所・大域の地形特徴を抽出し、サリent領域に注目する「解釈可能で汎用性のある埋め込み」を制御ポリシーに与える。
  • さらに、深度観測から局所的な地形(高低)と不確実性を推定する学習ベースのマッピング・パイプラインを導入し、オドメトリと融合してノイズや隠蔽に頑健な地形表現を高速に生成する。
  • 並列シミュレーションを活用してオンライン地図作成を行い、シミュレーションから実機への移行(sim-to-real)を支援する学習手法を組み合わせている。
  • クアドロプッドおよびバイペッドの実機・シミュレーション実験で、見たことのない地形への一般化と強い俊敏性が示された。

Abstract

障害物のある環境や疎な足場の状況を含む様々な地形にまたがる、俊敏で汎用的な脚型移動を実現するには、知覚と制御の緊密な統合が必要です。特に、遮蔽(オクルージョン)がある場合や足場が限られている場合に重要になります。既存の手法ではパルクールコースでの俊敏さが示されてきましたが、多くの場合、限定的な汎化性と解釈可能性しか持たないエンドツーエンドのセンサー・モータモデルに依存しています。一方で、汎用移動を対象とする手法は、俊敏さが限定的であり、視覚的な遮蔽への対処が難しい傾向があります。そこで本研究では、制御方策に新規の注意(アテンション)ベースの地図エンコーダを組み込んだ、俊敏で汎用的な移動のための統一型強化学習(RL)フレームワークであるAME-2を提案します。このエンコーダは、局所的および大域的なマッピング特徴を抽出し、注意メカニズムによって注目すべき領域に焦点を当てます。これにより、RLベースの制御に用いるための、解釈可能で汎化可能な埋め込み表現を生成します。さらに、ノイズや遮蔽に対して頑健で、不確実性を考慮した高速な地形表現を方策の入力として提供する、学習ベースのマッピング処理パイプラインも提案します。このパイプラインは、深度観測から不確実性を伴う局所的な地面高さをニューラルネットワークで変換し、それをオドメトリと融合します。また、本パイプラインは並列シミュレーションと統合されており、オンライン・マッピングによる制御器の学習が可能です。これにより、sim-to-real(シミュレーションから実機)への転移を支援します。提案したマッピング処理パイプラインとともに、AME-2を四足ロボットおよび二足ロボットで検証します。その結果得られた制御器は、シミュレーションおよび実世界の実験の両方において、未見の地形に対して強い俊敏性と汎化性を示しました。