WebUncertainty：デュアルレベル不確実性に駆動された計画と推論による自律Webエージェント

arXiv cs.AI / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

この論文は、実環境の動的なWebページ上で複雑かつ長期的なタスクを扱う自律Webエージェントのための枠組み「WebUncertainty」を提案しています。
未知の環境における不確実性に応じて、計画モードを切り替える「タスク不確実性駆動の適応計画」メカニズムを導入しています。
行動レベルでは、ConActUにより（不確実性の）アレアトリック不確実性とエピステミック不確実性を定量化し、探索中の意思決定を改善する「行動不確実性駆動のMCTS推論」を追加しています。
WebArenaおよびWebVoyagerベンチマークでの実験により、WebUncertaintyが既存の最先端手法より高い性能を示しています。
本研究は、従来エージェントの主要な課題である硬直的な計画と幻覚を含みやすい推論に対し、不確実性を計画段階と行動段階の双方で明示的にモデル化することで対処します。

要旨: 近年の大規模言語モデル（LLM）の進歩により、自律型ウェブエージェントが実世界のウェブページ上で自然言語の指示を直接実行できるようになってきました。しかし、既存のエージェントは、硬直した計画戦略や幻覚を起こしやすい推論のために、動的な相互作用や長い実行期間を伴う複雑なタスクにおいてしばしば困難を抱えます。これらの制約に対処するために、計画と推論における二重レベルの不確実性に取り組むことを目的とした新しい自律エージェント枠組みであるWebUncertaintyを提案します。具体的には、未知の環境を探索するために計画モードを適応的に選択する、タスク不確実性駆動型の適応的計画メカニズムを設計します。さらに、行動不確実性駆動型のモンテカルロ木探索（MCTS）推論メカニズムを導入します。このメカニズムでは、確信に誘発された行動不確実性（ConActU）戦略を組み込み、異質性（aleatoric）不確実性（AU）と認識論的（epistemic）不確実性（EU）の両方を定量化することで、探索プロセスを最適化し、堅牢な意思決定を導きます。WebArenaおよびWebVoyagerベンチマークにおける実験結果は、WebUncertaintyが最先端のベースラインと比べて優れた性能を達成することを示しています。