Agile-VLA:暗黙的アフォーダンスアンカリングによる少数ショット産業用姿勢修正
arXiv cs.RO / 2026/3/25
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- Agile-VLAは、クローズドループ操作におけるレイテンシと制御周波数の競合を扱いながら、エッジデバイス上で産業用姿勢修正を行うための階層型VLAフレームワークとして提示される。
- 主要な革新であるImplicit Affordance Anchoringは、幾何学的な視覚的手がかり(重心およびリムのキーポイントアンカー)を、構造化されたパラメトリックな行動プリミティブへと変換し、遅いセマンティック推論への依存を低減する。
- 本手法は、知覚を約10 Hzで実行するストリームと、制御を約50 Hzで実行するストリームを非同期に分離するデュアルストリーム構成を用い、エッジベースのロボット学習で典型的に生じる周波数不一致に対処する。
- 6自由度(6-DoF)マニピュレータでの実験では、5ショットのデモンストレーションのみで複雑で不規則なワークピースに対する頑健な姿勢修正が示され、外的巧緻性タスクにおける強力な少数ショット性能が示唆される。