Deep Researcher Agent:ゼロコスト・モニタリングによる24/7ディープラーニング実験のための自律型フレームワーク

arXiv cs.AI / 2026/4/8

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • Deep Researcher Agentは、書き込みやコード生成だけに焦点を当てるのではなく、仮説、実装、学習、分析、反復といったディープラーニング実験ライフサイクル全体を継続的に自律実行するためのオープンソースのLLMエージェント・フレームワークです。
  • 「ゼロコスト・モニタリング」を提案しており、学習中のLLM APIの利用を回避します。具体的には、プロセスレベルのチェックとログファイルの読み取りを用いて進捗を追跡することで、追加のモデルコストを発生させずに済むようにします。
  • さらに、「2層の一定サイズ・メモリ」を追加し、コンテキストを約~5K文字程度に制限します。これにより、24/7で長時間稼働するエージェント環境でのコンテキスト無制限な増大を防ぐことを狙っています。
  • 「最小ツールセットのリーダー-ワーカー」型のマルチエージェント構成を採用し、各ワーカーに与えるツールを3〜5個に限定します。これにより、呼び出しごとのトークン/ツールコールのオーバーヘッドを最大73%削減できるとしています。
  • 30日以上にわたる継続稼働では、4つの並行プロジェクトにおいて500回以上の実験サイクルを実行したと報告されています。さらに、そのうち1つでは、200回以上の自動化実験により52%の改善を達成し、24時間サイクルあたりの平均コストは$0.08でした。

Abstract

私たちは、 extbf{Deep Researcher Agent} を提示します。これはオープンソースのフレームワークであり、大規模言語モデル(LLM)エージェントが24時間体制で自律的に深層学習の実験を遂行できるようにします。論文執筆やコード生成に焦点を当てる既存のAI研究アシスタントとは異なり、私たちのシステムは実験ライフサイクル全体を扱います。すなわち、仮説形成、コード実装、学習実行、結果分析、そして反復的な改良です。このフレームワークは、3つの重要な革新を導入します。(1) extbf{Zero-Cost Monitoring} -- モニタリングのパラダイムとして、モデル学習中にLLM APIコストを一切発生させない仕組みを提供します。これは、プロセスレベルのチェックとログファイルの読み取りのみに依存することで実現します。(2) extbf{Two-Tier Constant-Size Memory} -- メモリの構成を ightrough 約5K文字に上限しており、実行時間の長さにかかわらず一定です。これにより、長時間稼働するエージェントに付きまとう、コンテキストの無制限な増大を防ぎます。(3) extbf{Minimal-Toolset Leader-Worker Architecture} -- マルチエージェント設計であり、各ワーカー・エージェントには 3--5 個のツールのみを装備します。これにより、1回あたりのトークン・オーバーヘッドを最大 73 extbackslash% 削減します。30日以上に及ぶ継続的なデプロイメントでは、フレームワークは4つの並行する研究プロジェクトにまたがって500回以上の実験サイクルを自律的に完了し、あるプロジェクトでは200回以上の自動実験を通じてベースライン指標よりも52 extbackslash% の改善を達成しました。しかも、平均LLMコストは24時間サイクルあたりわずか 0.08ドルです。コードは https://github.com/Xiangyue-Zhang/auto-deep-researcher-24x7 で公開されています。