要旨: 現在の自律型科学研究(ASR)システムは、大規模言語モデル(LLM)やエージェント型アーキテクチャを活用しているにもかかわらず、進化するタスクや環境に適応できない固定されたワークフローとツールセットによって制約されています。そこで本研究では、実験フィードバックを通じてタスク固有のマルチエージェントワークフローを自動的に合成し、反復的に改良する、進化するマルチエージェントフレームワークであるMimosaを提案します。Mimosaは、動的なツール発見のためにModel Context Protocol(MCP)を活用し、メタオーケストレータによってワークフロートポロジーを生成し、利用可能なツールや科学ソフトウェアライブラリを呼び出すコード生成エージェントによってサブタスクを実行します。そして、実行結果はLLMベースのジャッジによってスコア付けされ、そのフィードバックがワークフローの改良を導きます。ScienceAgentBenchにおいて、MimosaはDeepSeek-V3.2を用いて成功率43.1%を達成し、単一エージェントのベースラインと静的なマルチエージェント構成の両方を上回ります。さらに我々の結果は、モデルがマルチエージェントの分解および反復学習に対して不均一に応答することを示しており、ワークフロー進化の利点は、基盤となる実行モデルの能力に依存することがうかがえます。これらのベンチマークを超えて、Mimosaのモジュール式アーキテクチャと、ツールに依存しない設計により、容易に拡張可能です。また、完全にログ化された実行トレースとアーカイブされたワークフローは、各分析ステップを検査や潜在的な再現のために保存することで、監査可能性を支えます。ドメイン専門家のガイダンスと組み合わせることで、本フレームワークは、分野をまたいで計算的に実行可能な幅広い科学タスクを自動化する可能性を持ちます。完全にオープンソースのプラットフォームとして公開されるMimosaは、コミュニティ主導のASRのためのオープンな基盤を提供することを目指します。
ミモザ・フレームワーク:科学研究のための進化するマルチエージェントシステムに向けて
arXiv cs.AI / 2026/4/1
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本記事は、固定された手順に依存するのではなく、変化するタスクや環境に合わせてワークフローを適応させる自律的な科学研究のための、進化型マルチエージェント・フレームワーク「Mimosa」を提案する。
- Mimosaは、動的なツール発見にModel Context Protocol(MCP)を用い、マルチエージェントのワークフロートポロジを生成するメタオーケストレータ、そして科学ソフトウェアのライブラリを介してサブタスクを実行するコード生成エージェントを活用する。
- 実行品質はLLMベースの判定者によって評価され、そのフィードバックが繰り返しの実験サイクルにわたってワークフローを段階的に改良する。
- ScienceAgentBenchにおいて、MimosaはDeepSeek-V3.2で43.1%の成功率を達成し、単一エージェントのベースラインおよび静的なマルチエージェント設定の両方を上回る一方で、分解と反復に対しては応答が不均一であることを示す。
- このフレームワークは、完全にオープンソースでモジュール化され、ツールに依存しないプラットフォームとして公開されており、実行ログのトレースとアーカイブされたワークフローにより監査可能性を高め、研究コミュニティによる拡張性も支援する。




