Mango：グローバルビュー最適化によるマルチエージェントWebナビゲーション

arXiv cs.CL / 2026/4/22

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

共有:

要点

この論文では、Webサイト構造を活用してルートURLから探索を始める代わりに、より適切な開始URLを動的に選ぶマルチエージェントWebナビゲーション手法としてMangoを提案しています。
MangoはURL選択をマルチアーム・バンディット問題として定式化し、Thompson Samplingにより候補URL間で探索予算を適応的に配分します。
ナビゲーション履歴を保存するエピソード記憶コンポーネントを追加することで、過去の試行から学習し、無駄な探索を減らすことを狙っています。
WebVoyagerでの実験では、GPT-5-miniを用いたMangoが成功率63.6%を達成し、最良ベースラインを7.3%上回り、WebWalkerQAでは52.5%で26.8%上回りました。
さらに、オープンソース/クローズドソースの両方のモデルをバックボーンとしても汎用性が示され、データとコードはGitHubで公開されています。

概要: 既存のWebエージェントは通常、探索をルートURLから開始しますが、深い階層構造を持つ複雑なWebサイトでは非効率です。Webサイト構造に関する全体像がないと、エージェントはしばしばナビゲーションの罠に陥り、無関係な分岐を探索したり、限られた予算の中で目標となる情報に到達できなかったりします。私たちは、Webサイト構造を活用して最適な開始地点を動的に決定するマルチエージェントWebナビゲーション手法であるMangoを提案します。URL選択をマルチアーム・バンディット問題として定式化し、候補URLに対してナビゲーション予算を適応的に配分するためにThompson Samplingを用います。さらに、ナビゲーション履歴を保存するエピソード型メモリ要素を導入し、エージェントが過去の試行から学習できるようにします。WebVoyagerにおける実験により、MangoはGPT-5-miniを用いた場合に成功率63.6%を達成し、最良のベースラインを7.3%上回ることを示します。さらにWebWalkerQAでは、Mangoは成功率52.5%に到達し、最良のベースラインを26.8%上回ります。また、バックボーンとしてオープンソースモデルとクローズドソースモデルの両方を用いて、Mangoの汎化性も実証します。私たちのデータとコードはオープンソースであり、https://github.com/VichyTong/Mango で利用可能です。

Black Hat USA

AI Business

視覚におけるオートエンコーダと表現学習

Dev.to

あらゆるAI投資アプリはあなたのデータを欲しがる――信用できなかったので、オフラインで自分のものを作った

Dev.to

URLひとつでClaudeを操作可能に—Chrome拡張「Send to Claude」が非常に便利

Dev.to

Google Stitch 2.0：数秒でシニア級UIを生成できるが、編集はまだ壊れる

Dev.to

Mango：グローバルビュー最適化によるマルチエージェントWebナビゲーション

要点

関連記事

Black Hat USA

視覚におけるオートエンコーダと表現学習

あらゆるAI投資アプリはあなたのデータを欲しがる――信用できなかったので、オフラインで自分のものを作った

URLひとつでClaudeを操作可能に—Chrome拡張「Send to Claude」が非常に便利

Google Stitch 2.0：数秒でシニア級UIを生成できるが、編集はまだ壊れる

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer