Agile-VLA:暗黙的アフォーダンスアンカリングによる少数ショット産業用姿勢修正

arXiv cs.RO / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • Agile-VLAは、クローズドループ操作におけるレイテンシと制御周波数の競合を扱いながら、エッジデバイス上で産業用姿勢修正を行うための階層型VLAフレームワークとして提示される。
  • 主要な革新であるImplicit Affordance Anchoringは、幾何学的な視覚的手がかり(重心およびリムのキーポイントアンカー)を、構造化されたパラメトリックな行動プリミティブへと変換し、遅いセマンティック推論への依存を低減する。
  • 本手法は、知覚を約10 Hzで実行するストリームと、制御を約50 Hzで実行するストリームを非同期に分離するデュアルストリーム構成を用い、エッジベースのロボット学習で典型的に生じる周波数不一致に対処する。
  • 6自由度(6-DoF)マニピュレータでの実験では、5ショットのデモンストレーションのみで複雑で不規則なワークピースに対する頑健な姿勢修正が示され、外的巧緻性タスクにおける強力な少数ショット性能が示唆される。