120分とラップトップ:教師なし探索とオフラインRLによる最小限の画像目標ナビゲーション
arXiv cs.RO / 2026/3/30
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、巨大な事前学習データセットや大規模な計算資源への依存を避け、院内で収集したデータから学習することで実現する、画像目標に基づく視覚ナビゲーション手法MINavを提案する。
- MINavは、ナビゲーションをオフラインの目標条件付き強化学習として捉え、経験を収集するための教師なし探索と、収集した軌跡から学習を改善するためのindsight(後知恵)目標リレベリングを用いる。
- 著者らは、人の介入なしでコンシューマ向けのラップトップのみを用いて、120分未満で実環境のナビゲーションに向けたポリシーを収集・学習・実デプロイできることを報告する。
- シミュレーション環境と実環境の両方での実験により、探索効率の向上、ゼロショットのナビゲーション基準手法よりも良好な性能、データセット規模に対して望ましいスケーリング特性が示されている。
- 全体として本研究は、実環境デプロイに向けた高速で計算負荷の軽いパイプラインを示すことで、ロボットのポリシー試作を迅速に行うための障壁を下げることを目指している。
