概要: 言語モデルのエージェントシステムは一般に、リアクティブ・プロンプト(reactive prompting)に依存しています。そこでは、単一の指示がモデルを開放的な推論とツール利用の一連のステップへ導きますが、制御フローと中間状態が暗黙になってしまい、エージェントのふるまいを制御しにくい可能性があります。LangGraph、DSPy、CrewAI のようなオーケストレーション・フレームワークは、明示的なワークフロー定義によってより強い構造を課しますが、ワークフローのロジックを Python に密結合させるため、エージェントの保守や変更が難しくなります。本論文では、LLMエージェントのワークフローを、明示的な制御フローとモジュール構造で指定するためのエージェント仕様記述実行言語 AgentSPEX(Agent SPecification and EXecution Language)と、カスタマイズ可能なエージェント・ハーネスを提案します。AgentSPEX は、型付きステップ、分岐やループ、並列実行、再利用可能なサブモジュール、明示的な状態管理をサポートし、これらのワークフローは、ツールアクセス、サンドボックス化された仮想環境、チェックポイント取得、検証、ログ記録を支援するエージェント・ハーネス上で実行されます。さらに、グラフ表示とワークフロー表示を同期させた視覚エディタも提供し、執筆と検査を可能にします。深いリサーチおよび科学リサーチ向けの既成エージェントを用意し、7つのベンチマークで AgentSPEX を評価します。最後に、ユーザースタディにより、AgentSPEX が、既存の人気あるエージェント・フレームワークよりも解釈可能で利用しやすいワークフロー作成のパラダイムを提供することを示します。
AgentSPEX: エージェントの仕様化と実行のための言語
arXiv cs.CL / 2026/4/16
📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- AgentSPEXは、LLMエージェントのワークフローを「反応的プロンプト」ではなく、明示的な制御フローと状態管理を備えた言語で仕様化・実行するための提案です。
- 型付きステップ、分岐・ループ、並列実行、再利用可能なサブモジュール、モジュール化された明示状態により、既存のオーケストレーションにおける暗黙性や保守性の課題を補います。
- AgentSPEXは、エージェント・ハーネス(ツールアクセス、サンドボックス環境、チェックポイント、検証、ログ)上でワークフローを実行し、運用面の可観測性も重視しています。
- 可視化エディタ(グラフとワークフローの同期表示)を提供し、著作・検査を支援するほか、深層/科学研究向けの既製エージェントと7つのベンチマーク評価、ユーザースタディにより、解釈可能性・利用しやすさを示しています。




