小型モデルをマスターオーケストレーターに:並列サブタスク分解で統一エージェント—ツール・オーケストレーションを学習する
arXiv cs.AI / 2026/4/21
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、静的なワークフローや逐次的なスケジューリングに依存し、ツール/エージェント間の異なるインターフェースにより拡張性が損なわれやすい既存のマルチエージェント・オーケストレーション手法の限界を扱います。
- 「Agent-as-Tool」を提案し、プロトコル正規化と明示的な状態フィードバックによって、エージェントとツールを標準化された学習可能なアクション空間の要素として扱う統一的な並列オーケストレーション枠組みを示します。
- このパラダイムに基づき、ParaManagerという軽量オーケストレーターを学習し、計画とサブタスク解決を分離し、状態に応じた並列分解、委任、非同期実行を可能にします。
- 学習では2段階のパイプラインを用い、回復メカニズム付きの教師あり微調整(SFT)に加えて、強化学習でタスク成功、プロトコル順守、多様性、推論効率の最適なバランスを目指します。
- 実験では、ParaManagerが複数ベンチマークで高い性能を示し、未見のモデル群に対しても頑健に一般化できることが示されます。




