PASK:長期記憶を備えた意図を認識するプロアクティブエージェントに向けて

arXiv cs.CL / 2026/4/10

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、リアル環境での長期・遅延制約下における「意図を理解したプロアクティブエージェント」を目標に、文脈から潜在ニーズを推定しつつ、ユーザーの長期記憶に基づいて行動を行う課題設定を扱っている。
  • DD-MM-PAS(Demand Detection, Memory Modeling, Proactive Agent System)というストリーミング型プロアクティブエージェントの一般パラダイムを提案し、これをPaskという具体システムとして実装した。
  • Paskでは、需要検出にストリーミングのIntentFlowモデル、長期記憶にworkspace/user/globalを組み合わせたハイブリッドメモリ、そしてPASの基盤(infra)によりクローズドループ動作を構成している。
  • 実世界のベンチマークとしてLatentNeeds-Bench(ユーザー同意データを基に人手編集を多数回行って作成)を導入し、IntentFlowが遅延制約下で上位のGemini3-Flash系モデルに匹敵しつつ、より深いユーザー意図の識別を示した。

要旨: 主体性(Proactivity)は、AGIに対して中核的に期待される性質である。これまでの研究は、ほとんどが実験室環境にとどまっており、現実世界の能動的エージェントには明確なギャップが残されている。具体的には、深さ、複雑性、不確実性、精度、そしてリアルタイム制約の観点である。本研究ではこの設定を扱う。有用な介入には、進行中の文脈から潜在的なニーズを推論し、レイテンシおよび長いホライゾンの制約のもとで、進化するユーザの記憶に基づいて行動を実行することが必要となる。我々は、ストリーミング型の能動的AIエージェントのための一般的なパラダイムとして、最初にDD-MM-PAS(Demand Detection、Memory Modeling、Proactive Agent System)を提案する。このパラダイムをPaskに実装する。DDにはストリーミングIntentFlowモデルを用い、長期MMにはハイブリッドなメモリ(workspace、user、global)を用いる。さらにPASのインフラフレームワークを導入し、これらの構成要素がどのようにクローズドループを形成するかを示す。また、LatentNeeds-Benchを導入する。これは、ユーザの同意に基づくデータから構築され、数千ラウンドの人手による編集によって洗練された現実世界のベンチマークである。実験の結果、IntentFlowはレイテンシ制約下で先行するGemini3-Flashモデル群に匹敵する一方で、より深いユーザの意図を特定できることが示された。