概要: 農業用ロボットエージェントは、幅広い農業タスクにおいて有用な支援者になりつつあります。しかし、現在も移動のために手作業や固定レールに大きく依存しています。この制約に対処するため、AgriVLN手法とA2Aベンチマークは先駆的に、Vision-and-Language Navigation(VLN)を農業領域へ拡張し、自然言語の指示に従ってエージェントが目標位置へナビゲートできるようにします。私たちは、AgriVLNが単純な指示を効果的に理解できる一方で、複雑な指示を誤解することが多いことを観察しています。このギャップを埋めるために、T-araVLN手法を提案します。この手法では、指示トランスレータ(翻訳)モジュールを構築し、不正確で誤った指示を、洗練された正確な表現へと変換します。A2Aで評価したところ、私たちのT-araVLNは成功率(Success Rate: SR)を0.47から0.63へ改善し、ナビゲーション誤差(Navigation Error: NE)を2.91mから2.28mへ低減することに成功し、農業VLN領域における最先端の性能を示しました。コード: https://github.com/AlexTraveling/T-araVLN.
T-araVLN:視覚と言語に基づくナビゲーションのための農業ロボットエージェント向けトランスレータ
arXiv cs.RO / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ノイズや誤りのある自然言語の指示を、ロボットエージェントが扱いやすい洗練された表現へ変換することで、農業における視覚と言語ナビゲーションを改善するためのトランスレータモジュール「T-araVLN」を提案する。
- それはAgriVLNを土台として、A2Aベンチマークを通じて、自然言語により目標位置への移動を行うような農業向けの環境にVision-and-Language Navigation(VLN)パラダイムを拡張する。
- 実験では、AgriVLNは単純な指示には適切に対応できる一方で、複雑な指示では課題があることが示され、これがT-araVLNにおける指示翻訳アプローチの動機となっている。
- A2A評価において、T-araVLNはSuccess Rateを0.47から0.63へ引き上げ、Navigation Errorを2.91mから2.28mへ低減し、農業VLN分野での最先端の結果を達成した。
- 著者らは再現性の支援と、農業における指示追従ナビゲーションに関するさらなる研究のために、コードをGitHubで公開している。
広告




