ANX:サポートする3EXデカップルド・アーキテクチャによるAIエージェント相互作用のためのプロトコル・ファースト設計

arXiv cs.AI / 2026/4/7

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、GUIオートメーションおよびMCPベースのスキルにおける非効率性とセキュリティ上のギャップに対処するために設計された、オープンで拡張可能かつ検証可能なプロトコル・ファーストのフレームワーク「ANX」を提案する。
  • ANXのアーキテクチャは、情報密度を高め、トークン使用量を削減し、相互作用の不整合を防ぐために、エージェントネイティブなコンポーネント(ANX Config/Markup/CLI)を組み合わせる。
  • エージェントが実行可能な指示と、人が読めるUIの両方を支えるスキルのような能力を用いる、人とエージェントの相互作用モデルを提案し、さらに自動化された悪用を緩和するための「人によるみの確認」を追加する。
  • このフレームワークには、事前登録なしでオンデマンドに軽量アプリを扱えるMCP対応機能が含まれ、ANX Markupを用いて、長期の信頼性の高いタスクやマルチエージェント協調のための、曖昧さのない機械実行可能なSOP(標準作業手順)を作成する。
  • Qwen3.5-plusおよびGPT-4oを用いた予備実験では、MCPスキルまたはGUIオートメーションに比べておおよそ47〜66%のトークン削減が報告され、さらに試験シナリオにおいて実行時間が約58%改善したとされる。

要旨: AIエージェント、自律的なデジタル実行主体は、エージェントネイティブなプロトコルを必要とします。既存の手法にはGUI自動化やMCPベースのスキルがありますが、高いトークン消費、相互作用の断片化、適切でないセキュリティという欠点があり、統一されたトップレベルのフレームワークと主要コンポーネントが欠けているため、各独立モジュールがそれぞれ抱える問題が増幅されています。これらの課題に対処するために、私たちはANXを提案します。これはオープンで拡張可能かつ検証可能なエージェントネイティブ・プロトコルとトップレベルのフレームワークであり、CLI、Skill、MCPを統合し、プロトコルの革新、アーキテクチャ最適化、ツールの補完によって痛点を解決します。ANXの4つの中核的な革新は次のとおりです。1) エージェントネイティブ設計(ANX Config、Markup、CLI)により、情報密度を高め、柔軟性と強い適応性を実現してトークンを削減し、不整合を排除します。2) Skillの柔軟性を組み合わせたヒューマン-エージェント相互作用により、エージェント実行可能な指示と、人に読めるUIの両方へのデュアルレンダリングを可能にします。3) 事前登録なしで、必要に応じて軽量アプリを呼び出せるMCP対応。4) ANX Markupによって機械実行可能なSOP(標準作業手順)を有効化し、曖昧さを排除して、信頼性の高い長期タスクと複数エージェントの協調を実現します。シリーズの最初として、私たちはANXの設計に焦点を当て、ANXHubを用いた3EXの疎結合アーキテクチャを提示し、予備的な実現可能性の分析と実験による検証を行います。ANXはネイティブなセキュリティを保証します。LLMを介さないUIからCoreへの通信により、機密データがエージェント文脈から外れます。さらに、人間のみの確認によって自動化された誤用を防止します。Qwen3.5-plus/GPT-4oによるフォーム記入実験では、ANXはMCPベースのスキルに比べてQwen3.5-plusでトークンを47.3%削減し、GPT-4oで55.6%削減します。GUI自動化に比べては、Qwen3.5-plusで57.1%、GPT-4oで66.3%削減し、また実行時間をMCPベースのスキルに比べて58.1%と57.7%短縮します。

ANX:サポートする3EXデカップルド・アーキテクチャによるAIエージェント相互作用のためのプロトコル・ファースト設計 | AI Navigate