検証済みマルチエージェント・オーケストレーション: 複雑なクエリ解決のための Plan-Execute-Verify-Replan フレームワーク

arXiv cs.AI / 2026/3/13

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

VMAO は、検証駆動型のマルチエージェント・オーケストレーションフレームワークで、専門の LLM ベースのエージェントを、サブ質問の有向非巡回グラフ（DAG）上の計画-実行-検証-再計画ループを介して協調させます。
複雑なクエリを DAG に分解し、依存関係を踏まえたコンテキスト伝搬を伴ってサブ質問を並行実行し、効率を向上させます。
オーケストレーション層で LLM ベースの検証機を用いて結果の網羅性を評価し、ギャップに対処するための適応的な再計画を推進します。
設定可能な停止条件を提供し、回答品質とリソース使用量のバランスを取り、25 件の専門家監修の市場調査クエリで、単一エージェントのベースラインと比較して、網羅性を 3.1 から 4.2、ソース品質を 2.6 から 4.1（1-5 のスケール）へ改善を示します。

本文: arXiv:2603.11445v1 アナウンス種別: new 要旨: 我々は検証駆動型マルチエージェント・オーケストレーション（VMAO）を提示します。これは、検証駆動の反復ループを通じて専門の LLM ベースのエージェントを調整するフレームワークです。複雑なクエリが与えられると、システムはそれをサブ質問の有向非巡回グラフ（DAG）に分解し、ドメイン固有のエージェントを用いて並行実行し、LLM ベースの評価によって結果の完結性を検証し、ギャップに対処するために適応的に再計画します。主な貢献は次のとおりです: (1) 自動的な文脈伝搬を伴うサブ質問の DAG 上での依存関係を考慮した並列実行、(2) LLM ベースの検証器を用いる検証駆動型の適応再計画、(3) 質問の品質とリソース使用量のバランスを取る設定可能な停止条件。25 件の専門家が監修した市場調査クエリに対して、VMAO は単一エージェントのベースラインと比較して、回答の完結性を 3.1 から 4.2、ソース品質を 2.6 から 4.1（1〜5 のスケール）へ改善を示し、協調レベルの検証がマルチエージェントの品質保証に有効なメカニズムであることを示しています。

EU AI Act適合性のために11,529台のMCPサーバをスキャンしました

Dev.to

テックキャリアに4年間も費やしている

Dev.to

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す

THE DECODER

[P] allToall アーキテクチャを用いたデータ並列で 3 台の Mac Minis M4 上で Llama3.2-1B-Instruct の推論！ | smolcluster

Reddit r/MachineLearning

NVIDIA V100 32GB が Qwen Coder 30B A3B Q5 で約115トークン/秒を達成

Reddit r/LocalLLaMA

検証済みマルチエージェント・オーケストレーション: 複雑なクエリ解決のための Plan-Execute-Verify-Replan フレームワーク

要点

関連記事

EU AI Act適合性のために11,529台のMCPサーバをスキャンしました

テックキャリアに4年間も費やしている

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す

[P] allToall アーキテクチャを用いたデータ並列で 3 台の Mac Minis M4 上で Llama3.2-1B-Instruct の推論！ | smolcluster

NVIDIA V100 32GB が Qwen Coder 30B A3B Q5 で約115トークン/秒を達成

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer