Mind DeepResearch テクニカルレポート

arXiv cs.AI / 2026/4/17

📰 ニュースIndustry & Market MovesModels & Research

共有:

要点

Mind DeepResearch（MindDR）は、データ合成とマルチステージ学習のパイプラインを工夫することで、約30Bパラメータ規模のモデルのみで高い性能を実現する効率的なマルチエージェントによるディープリサーチ・フレームワークとして提案されます。
MindDRの中核は、Planning Agent、DeepSearch Agent、Report Agentの3エージェントによる協調アーキテクチャと、SFTコールドスタート、Search-RL、Report-RL、嗜好（プリファレンス）アラインメントの4段階からなるエージェント特化トレーニングにあります。
評価では、MindDRが複数のベンチマーク（BrowseComp-ZH、BrowseComp、WideSearch、xbench-DS、DeepResearch Benchなど）で同規模のオープンソースエージェントを上回り、大規模モデルに迫る性能を示したと報告されています。
さらに、MindDRはLi Autoでオンライン製品として導入されていることに加え、実運用の中国語クエリ500件を対象に単一指標ではなく多面的なルーブリックで評価する「MindDR Bench」も新たに提示され、SOTAスコア51.8を達成しています。

a 、「BrowseComp」で 42.8 hinspace
a、「WideSearch」で 46.5 hinspace
a、「xbench-DS」で 75.0 hinspace
a、「DeepResearch Bench」で 52.5 を達成し、同等規模のオープンソースのエージェントシステムを上回り、さらに大規模モデルに匹敵する性能を示します。MindDR は Li Auto においてオンライン製品として展開されています。さらに本稿では、 extbf{MindDR Bench} として、社内のプロダクト利用者とのインタラクションから得た実世界の中国語クエリ 500 件を厳選したベンチマークを導入します。単一の RACE 指標に依存するのではなく、包括的な多次元のルーブリック体系で評価します。MindDR Bench において、MindDR は最先端のスコアである 51.8 を達成しています。