要旨: AIエージェント・システムの急速な発展により、専門化されたエージェントがローカル端末、エッジノード、プライベートサービス、クラウド基盤にまたがって動作する、新たなエージェントのインターネット(Internet of Agents)が出現しつつある。エージェントの命名、発見(ディスカバリー)、および相互作用については、近年の取り組みにより改善が進んできたものの、効率的なリクエストのディスパッチは、レイテンシ、プライバシー、コストという制約のもとでのオープンなシステム課題として残っている。本論文では、候補(candidate)を意識したエージェント・ディスパッチのための軽量な構造化ルーティングエンジンであるAgentGateを提示する。ルーティングを無制限のテキスト生成として扱うのではなく、AgentGateはこれを制約付きの意思決定問題として定式化し、2つの段階に分解する:アクション決定と構造的グラウンディングである。第1段階では、クエリが単一エージェント呼び出し、マルチエージェント計画、直接応答、または安全なエスカレーションをトリガーすべきかを決定し、第2段階では、選択されたアクションを、対象エージェント、構造化された引数、またはマルチステップ計画といった実行可能な出力へと具体化する。コンパクトモデルをこの設定に適応させるために、さらに、候補を意識した教師あり学習とハードネガティブ例を用いる、ルーティング指向の微調整手法を開発する。複数の3B~7Bのオープンウェイトモデルを対象とした、キュレーション済みのルーティングベンチマークでの実験により、コンパクトモデルは制約された状況下でも競争力のあるルーティング性能を提供できること、またモデル間の差は主に、アクション予測、候補選択、ならびに構造的グラウンディングの品質に反映されることが示される。これらの結果は、特にリソース制約下でルーティング判断を行わなければならない場合に、構造化ルーティングが効率的かつプライバシーを意識したエージェント・システムのための実現可能な設計ポイントであることを示している。
AgentGate:インターネット・オブ・エージェントに向けた軽量な構造化ルーティング・エンジン
arXiv cs.AI / 2026/4/10
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、「インターネット・オブ・エージェント」において、レイテンシ、プライバシー、コストの制約下でリクエストを効率的にディスパッチすることを目的とした、軽量な構造化ルーティング・エンジンであるAgentGateを提案する。
- ルーティングに対して開放的なテキスト生成を用いるのではなく、AgentGateはディスパッチを、2段階に分割された制約付きの意思決定問題として定式化する:アクションの意思決定と、構造に基づくグラウンディング。
- システムは、単一エージェントの呼び出し、多エージェントのプランニング、直接応答、安全なエスカレーションといった選択肢の中から判断し、選択したアクションを、実行可能な構造化出力(例:対象エージェント、引数、またはプラン)として具体化する。
- このルーティング設定でコンパクトなLLMを効果的に動作させるため、著者らは候補を意識した教師あり学習(candidate-aware supervision)とハードネガティブ例による、ルーティング指向のファインチューニングを提案する。
- いくつかの3B〜7Bのオープンウェイト・モデルを用いた、キュレーションされたベンチマークでの実験結果から、リソース制約のあるデプロイメントにおいて構造化ルーティングは実用的であることが示される。モデルの違いは主に、アクション予測、候補選択、グラウンディング品質に影響する。

