WebAggregator:Deep Researchエージェント基盤モデルの構成的推論能力を高める
arXiv cs.CL / 2026/4/30
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、Deep Researchエージェントの行動を「検索中心で推論不足」から「構成的な情報統合」へと転換することを目的にしたWebAggregatorという学習パイプラインを提案している。
- WebAggregatorは2段階で構成され、Proactive Explorerで相互に関連した知識を収集し、Compositional Logic Proposerで12個以上の構成ガイドラインを用いて複雑な質問へ知識を織り込む。
- 著者らは、50,000のWebサイトに基づく10,000の検証可能なQAペアからリジェクション・サンプリングにより高品質なSFTデータセットを構築している。
- 微調整後、WebAggregator-32Bは複数のベンチマークでGPT-4.1を上回り、Claude-3.7-Sonnetに匹敵すると報告されている。
- さらに、検索と推論の両方を重視する新しいWebAggregatorQAテストベッドを提示し、「検索の良さだけでは高性能に到達できず、真のボトルネックは推論にある」と示している。



