EvoMaster:スケールするエージェンティック・サイエンスのための基盤型エボルビング・エージェント・フレームワーク
arXiv cs.AI / 2026/4/21
📰 ニュースDeveloper Stack & InfrastructureIndustry & Market MovesModels & Research
要点
- 本論文は、「Agentic Science」を対象に、試行錯誤を通じて仮説を学習し洗練できるエージェントを可能にする、ドメイン非依存の進化型エージェント・フレームワーク「EvoMaster」を提案している。
- EvoMasterの中核設計は継続的な自己進化にあり、エージェントが自己批判しつつ実験サイクルを重ねて知識を漸進的に蓄積できるようにしている。
- 同フレームワークはスケールが容易で、開発者が約100行のコードで任意分野の自己進化型科学エージェントを構築・展開できると主張している。
- SciMasterエコシステムを機械学習や物理など複数領域に展開し、Humanity’s Last Exam、MLE-Bench Lite、BrowseComp、FrontierScienceの4つのベンチマークで最高水準の結果が報告されている。
- 一般用途のベースラインOpenClawと比べて相対的な改善が+159%〜+316%と大きく、次世代の自律的な科学的発見を支える基盤フレームワークとして有効性と汎用性を裏付けている(GitHubで公開)。




