GRAIL:SLM強化インデキシングによるリアルタイム・エージェント発見のための深い粒度のハイブリッド共鳴フレームワーク

arXiv cs.AI / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • この論文は、大規模なマルチエージェント協調に向けて高精度を維持しつつサブ400msのレイテンシを実現するエージェント発見フレームワーク「GRAIL」を提案しています。
  • 遅い大規模LLMによる意図解析を、SLM強化予測モジュールで置き換え、ミリ秒レベルで能力(タクソノミ)タグを出力します。
  • 取得(リトリーバル)の品質向上のために、GRAILは擬似ドキュメント拡張(合成クエリ)でエージェント記述を拡張し、密な検索での意味密度を高めます。
  • MaxSim Resonanceのマッチングでは、ユーザークエリと離散的なエージェント使用例の間の最大類似度を計算し、意味の希薄化を抑えて精度を高めます。
  • 新しいデータセットAgentTaxo-9K(9,240エージェント)での評価では、GRAILはLLM解析ベースラインに比べてエンドツーエンド発見レイテンシを79倍超に削減し、Recall@10でも従来のベクトル検索を上回ることを示しています。

要旨: 大規模言語モデル(LLM)ベースのエージェントのエコシステムが急速に拡大するにつれ、大規模なマルチエージェント協調のための効率的かつ正確な「エージェント発見(Agent Discovery)」が重要なボトルネックになっています。既存のアプローチは典型的に二分法に直面します。すなわち、意図解析のために高負荷なLLMに依存するために許容できないレイテンシ(しばしば30秒超)になるか、あるいは速度のために意味的精度を犠牲にするモノリシックなベクトル検索を用いるかです。このギャップを埋めるために、本研究では
\textbf{GRAIL}(Granular Resonance-based Agent/AI Link)を提案します。これは、精度を損なうことなく、発見レイテンシをサブ400msに達成する新しい枠組みです。GRAILは次の3つの重要な革新を導入します:(1)\textbf{SLM強化予測}:一般化されたLLMパーサを置き換え、ミリ秒レベルでの能力タグ予測のために特化して微調整した小型言語モデル(SLM)を用います;(2)\textbf{擬似ドキュメント拡張}:合成クエリによってエージェント記述を補強し、堅牢な密な(dense)検索のための意味密度を高めます;(3)\textbf{MaxSim共鳴}:ユーザークエリと離散的なエージェント利用例との間の最大類似度を計算する、きめ細かなマッチング機構であり、意味の希薄化を効果的に緩和します。\textbf{AgentTaxo-9K}で検証された本新しい大規模データセット(9,240のエージェント)において、GRAILはLLMパーシングのベースラインに比べてエンドツーエンドの発見レイテンシを\textbf{79\times}以上削減し、さらにRecall@10において従来のベクトル検索を大幅に上回ります。この枠組みは、「エージェントのインターネット(Internet of Agents)」に対するリアルタイム性を実現する、スケーラブルで産業レベルのソリューションを提供します。

GRAIL:SLM強化インデキシングによるリアルタイム・エージェント発見のための深い粒度のハイブリッド共鳴フレームワーク | AI Navigate