PASK: Toward Intent-Aware Proactive Agents with Long-Term Memory

arXiv cs.CL / 4/10/2026

💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisModels & Research

Key Points

  • 本論文は、リアル環境での長期・遅延制約下における「意図を理解したプロアクティブエージェント」を目標に、文脈から潜在ニーズを推定しつつ、ユーザーの長期記憶に基づいて行動を行う課題設定を扱っている。
  • DD-MM-PAS(Demand Detection, Memory Modeling, Proactive Agent System)というストリーミング型プロアクティブエージェントの一般パラダイムを提案し、これをPaskという具体システムとして実装した。
  • Paskでは、需要検出にストリーミングのIntentFlowモデル、長期記憶にworkspace/user/globalを組み合わせたハイブリッドメモリ、そしてPASの基盤(infra)によりクローズドループ動作を構成している。
  • 実世界のベンチマークとしてLatentNeeds-Bench(ユーザー同意データを基に人手編集を多数回行って作成)を導入し、IntentFlowが遅延制約下で上位のGemini3-Flash系モデルに匹敵しつつ、より深いユーザー意図の識別を示した。

Abstract

Proactivity is a core expectation for AGI. Prior work remains largely confined to laboratory settings, leaving a clear gap in real-world proactive agent: depth, complexity, ambiguity, precision and real-time constraints. We study this setting, where useful intervention requires inferring latent needs from ongoing context and grounding actions in evolving user memory under latency and long-horizon constraints. We first propose DD-MM-PAS (Demand Detection, Memory Modeling, Proactive Agent System) as a general paradigm for streaming proactive AI agent. We instantiate this paradigm in Pask, with streaming IntentFlow model for DD, a hybrid memory (workspace, user, global) for long-term MM, PAS infra framework and introduce how these components form a closed loop. We also introduce LatentNeeds-Bench, a real-world benchmark built from user-consented data and refined through thousands of rounds of human editing. Experiments show that IntentFlow matches leading Gemini3-Flash models under latency constraints, while identifying deeper user intent.