「El Agente Forjador」:量子シミュレーションのためのタスク駆動型エージェント生成

arXiv cs.AI / 2026/4/17

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • この論文は、科学的ワークフローを加速するために、計算ツールを自律的に分析・生成・検証・再利用するマルチエージェント枠組みEl Agente Forjadorを提案しています。
  • 4段階のループ(ツール分析→ツール生成→タスク実行→解の反復評価)により、ツール作成を新しい領域やライブラリの変化に適応させます。
  • 量子化学と量子ダイナミクスにまたがる24のタスクについて、5種類のコーディング・エージェント構成で、(1)タスクごとのゼロショットでのツール生成、(2)カリキュラム構築したツールセットの再利用、(3)ベースラインとしての直接解法、の3モードを比較しています。
  • 著者らは、ツール生成と再利用がベースラインよりも精度を一貫して改善すること、さらに強いコーディングエージェントが作ったツールセットを再利用するとAPIコストを下げつつ弱いエージェントの解の質を大きく高められることを示しています。
  • 事例として、異なる領域で作られたツール同士を組み合わせてハイブリッドな量子シミュレーション課題を解けることが示され、エージェントの能力を「明示的に実装されたもの」ではなく「解くべきタスク」によって定義するパラダイムが支持されています。

Abstract

科学のためのAIは、発見プロセスを加速させることを約束します。大規模言語モデル(LLM)とエージェント型ワークフローの登場により、拡大し続ける多様な科学的タスクを迅速化することが可能になりました。しかし、現在の世代のほとんどのエージェント型システムは、静的で人手によりキュレーションされたツールセットに依存しており、新しい領域や進化するライブラリへの適応を妨げています。私たちは、El Agente Forjador というマルチエージェント・フレームワークを提案します。この枠組みでは、ユニバーサルなコーディング・エージェントが、ツール分析、ツール生成、タスク実行、反復的な解法評価という4段階のワークフローを通じて、計算ツールを自律的に作り出し、検証し、再利用します。量子化学と量子ダイナミクスに関する5つのコーディング・エージェント構成にまたがる24のタスクで評価し、3つの運用モードを比較します。すなわち、タスクごとのゼロショットなツール生成、カリキュラムに基づいて構築されたツールセットの再利用、そしてベースラインとしてのコーディング・エージェントによる直接的な問題解決です。その結果、私たちのツール生成と再利用の枠組みは、ベースラインに比べて一貫して精度を向上させることが分かりました。また、より強力なコーディング・エージェントが構築したツールセットを再利用することで、APIコストを削減でき、より弱いコーディング・エージェントにおいても解の質を大幅に高められることを示します。ケーススタディではさらに、異なる領域のために作られたツールを組み合わせて、ハイブリッドなタスクを解けることを示しています。以上を総合すると、これらの結果は、LLMベースのエージェントが自身の科学的知識とコーディング能力を用いて、自律的に再利用可能な科学ツールを構築できることを示しており、エージェントの能力は、明示的にエンジニアリングされた実装によって定義されるのではなく、そのエージェントが設計して解くよう意図されたタスクによって定義される、というパラダイムを示唆しています。