プロアクティブエージェント研究環境:アクティブユーザーをシミュレートしてプロアクティブアシスタントを評価する
arXiv cs.AI / 2026/4/2
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、プロアクティブなアシスタントの開発が現実的なユーザーシミュレーションの欠如によって妨げられていると主張する。従来の手法はアプリを、状態を持たないツール呼び出しAPIとして扱い、状態を持つ連続的な環境として扱っていないためである。
- プロアクティブエージェント研究環境(Pare)を提案し、アプリケーションを有限状態機械としてモデル化することで、ユーザーシミュレータが状態を意識しつつナビゲートし、状態に依存したアクションを生成できるようにする。
- フレームワークは、コミュニケーション、プロダクティビティ、スケジューリング、ライフスタイルの各アプリを対象に合計143のタスクを扱うベンチマーク「Pare-Bench」に拡張される。
- Pare-Benchは、文脈の観測、目標の推論、適切な介入タイミングの判断、複数のアプリにまたがるアクションの調整といった主要能力を評価するために設計されている。




