要旨: グラフィカル・ユーザー・インターフェース(GUI)と身体化されたナビゲーションにおける近年の進歩は発展を促してきましたが、これらの領域は概ね孤立して進化し、データセットや学習パラダイムもばらばらでした。本論文では、両方のタスクがマルコフ決定過程(MDP)として定式化できることを観察し、それによってそれらを統一するための基礎となる原理が示唆されることを示します。そこで本論文では、GUIナビゲーションと身体化されたナビゲーションを単一の枠組みで統一できる最初の統一エージェントであるNaviMasterを提案します。具体的には、NaviMasterは(i) 単一の定式化を用いてGUIタスクと身体化タスクの双方のための軌跡を生成する、視覚的ターゲット軌跡収集パイプラインを提案します。(ii) 混合データに対して統一された強化学習フレームワークを用いることで、汎化性能を向上させます。(iii) 軌跡から効率よく学習できることを保証するために、新規の距離認識型報酬を設計します。ドメイン外ベンチマークに関する大規模な実験により、NaviMasterはGUIナビゲーション、空間アフォーダンス予測、身体化されたナビゲーションにおいて、最先端のエージェントを上回ることが示されます。さらにアブレーション研究により、統一学習戦略、データ混合戦略、報酬設計の有効性が確認されます。コード、データ、チェックポイントは https://iron-boyy.github.io/navimaster-page/ で利用可能です。
NaviMaster:GUIと身体移動(エンボディド)ナビゲーション課題のための統一方策の学習
arXiv cs.RO / 2026/3/26
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、GUIナビゲーションと身体移動(エンボディド)ナビゲーションをマルコフ決定過程(MDP)として定式化できるため、それらを別個の領域として扱うのではなく、統一された学習アプローチが可能になると主張している。
- GUIと身体移動の両方を学習する統一エージェント「NaviMaster」を提案し、共有された視覚-ターゲットの軌道(トラジェクトリ)収集パイプラインと、混合データで学習する単一の強化学習フレームワークによって統合学習を実現する。
- 収集した軌道からの学習効率を高めるために、距離に応じた報酬関数を含む。
- 実験では、領域外ベンチマークにおいてNaviMasterが、GUIナビゲーション、空間アフォーダンス予測、身体移動ナビゲーションの各領域で、先行の最先端エージェントを上回ると報告されている。加えて、アブレーション研究により、統一学習、データ混合、報酬設計の貢献が裏付けられている。
- 著者らは、再現やさらなる研究を支援するため、プロジェクトのWebサイトを通じてコード、データ、チェックポイントを提供している。