SciResearcher:フロンティア領域の科学的推論に向けたディープ・リサーチ・エージェントのスケーリング

arXiv cs.AI / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • SciResearcherは、フロンティア領域の科学的推論を可能にするために、エビデンスに基づく高品質な科学データを自動構築することを目的としたエージェント型フレームワークとして提案されました。
  • 既存のディープ・リサーチ・エージェントの限界として指摘される、「疎で不均一な学術ソース」に対処し、単なる事実記憶を超えて計算と高度な推論を要するワークフローを支える点が焦点です。
  • SciResearcherは概念的・計算的タスクを統合し、ツール連携の推論や長期(ロングホライゾン)能力を、情報獲得のプロセスを通じて引き出します。
  • 構築したデータを用いて、監督付き微調整とエージェント型強化学習によりSciResearcher-8Bを学習し、8B規模における新たな最先端の性能を報告しています。
  • ベンチマークではHLE-Bio/Chem-Goldで19.46%、SuperGPQA-Hard-BiologyとTRQA-Literatureでそれぞれ13〜15%の絶対的な改善を示し、複数のより大きいプロプライエタリなエージェントにも優るとしています。

要旨: 最前線の科学的推論は、自動化された科学的発見におけるAIエージェントの進展を後押しする重要な基盤として、急速に確立しつつあります。この課題に対する有望なアプローチとして、ディープリサーチ・エージェントが挙げられます。これらのモデルは、情報探索タスクに対する事後学習(post-training)を通じて、堅牢な問題解決能力を発達させますが、そのタスクは一般に、知識グラフの構築、または反復的なウェブ閲覧によって選別されます。しかし、こうした戦略には、本質的な限界があります。最前線の科学では、領域固有の知識が、疎で異種混在の学術ソースに分散しており、さらに問題解決には、単なる事実の想起をはるかに超える高度な計算と推論が要求されるためです。そこで私たちは、このギャップを埋めるために、最前線科学向けの完全自動エージェント型フレームワークであるSciResearcherを導入します。SciResearcherは、学術的根拠に基づく多様な概念的タスクおよび計算的タスクを統合しつつ、情報獲得、ツール統合型の推論、長期(long-horizon)能力を引き出します。キュレーションされたデータを用いて教師あり微調整(supervised fine-tuning)およびエージェント型強化学習(agentic reinforcement learning)を行うことで、私たちはSciResearcher-8Bを開発しました。これは、HLE-Bio/Chem-Goldベンチマークで19.46%を達成するエージェント基盤モデルであり、そのパラメータ規模において新たな最先端を確立し、いくつかのより大きな専有(proprietary)エージェントを上回ります。さらに、SuperGPQA-Hard-BiologyおよびTRQA-Literatureのベンチマークで、それぞれ絶対的な改善として13〜15%を達成します。総じて、SciResearcherは最前線の科学的推論のための自動データ構築に関する新たなパラダイムを提示し、将来の科学的エージェントに向けたスケーラブルな道筋を提供します。