WebAggregator：Deep Researchエージェント基盤モデルの構成的推論能力を高める

arXiv cs.CL / 2026/4/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、Deep Researchエージェントの行動を「検索中心で推論不足」から「構成的な情報統合」へと転換することを目的にしたWebAggregatorという学習パイプラインを提案している。
WebAggregatorは2段階で構成され、Proactive Explorerで相互に関連した知識を収集し、Compositional Logic Proposerで12個以上の構成ガイドラインを用いて複雑な質問へ知識を織り込む。
著者らは、50,000のWebサイトに基づく10,000の検証可能なQAペアからリジェクション・サンプリングにより高品質なSFTデータセットを構築している。
微調整後、WebAggregator-32Bは複数のベンチマークでGPT-4.1を上回り、Claude-3.7-Sonnetに匹敵すると報告されている。
さらに、検索と推論の両方を重視する新しいWebAggregatorQAテストベッドを提示し、「検索の良さだけでは高性能に到達できず、真のボトルネックは推論にある」と示している。

日経XTECH

Reddit r/MachineLearning

Dev.to

Dev.to

Dev.to