概要: 既存のWebエージェントは通常、探索をルートURLから開始しますが、深い階層構造を持つ複雑なWebサイトでは非効率です。Webサイト構造に関する全体像がないと、エージェントはしばしばナビゲーションの罠に陥り、無関係な分岐を探索したり、限られた予算の中で目標となる情報に到達できなかったりします。私たちは、Webサイト構造を活用して最適な開始地点を動的に決定するマルチエージェントWebナビゲーション手法であるMangoを提案します。URL選択をマルチアーム・バンディット問題として定式化し、候補URLに対してナビゲーション予算を適応的に配分するためにThompson Samplingを用います。さらに、ナビゲーション履歴を保存するエピソード型メモリ要素を導入し、エージェントが過去の試行から学習できるようにします。WebVoyagerにおける実験により、MangoはGPT-5-miniを用いた場合に成功率63.6%を達成し、最良のベースラインを7.3%上回ることを示します。さらにWebWalkerQAでは、Mangoは成功率52.5%に到達し、最良のベースラインを26.8%上回ります。また、バックボーンとしてオープンソースモデルとクローズドソースモデルの両方を用いて、Mangoの汎化性も実証します。私たちのデータとコードはオープンソースであり、https://github.com/VichyTong/Mango で利用可能です。
Mango:グローバルビュー最適化によるマルチエージェントWebナビゲーション
arXiv cs.CL / 2026/4/22
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- この論文では、Webサイト構造を活用してルートURLから探索を始める代わりに、より適切な開始URLを動的に選ぶマルチエージェントWebナビゲーション手法としてMangoを提案しています。
- MangoはURL選択をマルチアーム・バンディット問題として定式化し、Thompson Samplingにより候補URL間で探索予算を適応的に配分します。
- ナビゲーション履歴を保存するエピソード記憶コンポーネントを追加することで、過去の試行から学習し、無駄な探索を減らすことを狙っています。
- WebVoyagerでの実験では、GPT-5-miniを用いたMangoが成功率63.6%を達成し、最良ベースラインを7.3%上回り、WebWalkerQAでは52.5%で26.8%上回りました。
- さらに、オープンソース/クローズドソースの両方のモデルをバックボーンとしても汎用性が示され、データとコードはGitHubで公開されています。



