発表タイプ: クロス
要旨: 実運用環境の没入型対話システムは、応答性と長期的なタスク実行能力との間で持続的なトレードオフに直面します。軽量なターンではリアルタイムでの対話が可能ですが、計画とツール呼び出しを伴うリクエスト(例: 検索やメディア生成)は裾野の長い実行遅延を生み、ターンの取り回し、ペルソナの一貫性、そしてユーザーの信頼を低下させます。この課題に対処するため、DuCCAE(拡張と進化を伴う協働による対話)を提案します。これは、百度検索(Baidu Search)内にデプロイされた没入型対話のハイブリッドエンジンで、数百万人のユーザーにサービスしています。DuCCAEはリアルタイムの応答生成を非同期のエージェント的実行から切り離し、セッション文脈と実行トレースを保持する共有状態を介してそれらを同期させ、非同期の結果を進行中の対話に統合できるようにします。システムは、情報、対話、協働、拡張、進化の5つのサブシステムを統括して、マルチエージェント協働と継続的な改善を支えます。DuCCAEを、Du-Interactデータセットでのオフラインベンチマークと百度検索内での大規模本番評価を組み合わせた総合的なフレームワークを用いて評価します。実験結果は、DuCCAEがエージェント実行の信頼性と対話品質で強力なベースラインを上回りつつ、厳格なリアルタイム予算に合わせて待機時間を短縮できることを示しています。特に、2025年6月以降のデプロイメント指標は現実世界での有意な効果を裏付けており、Day-7のユーザーリテンションが34.2%へと3倍に増加し、複雑なタスク完了率が65.2%へと上昇しています。我々のハイブリッドアーキテクチャは、会話の連続性を保ちつつ信頼性のあるエージェント実行を可能にしており、産業界でのスケーラブルなエージェントシステムを展開するための実践的な指針を提供します。
DuCCAE: 協働・拡張・進化による没入型対話のハイブリッドエンジン
arXiv cs.AI / 2026/3/23
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- DuCCAEは、セッションの文脈と実行トレースを保持する共有状態を用いて、リアルタイム応答生成を非同期のエージェント実行から切り離す、百度検索内に展開されたハイブリッド対話エンジンです。
- このシステムは、Info、Conversation、Collaboration、Augmentation、Evolution の5つのサブシステムを連携させ、マルチエージェントの協働と継続的な改善を可能にします。
- オフラインおよび本番環境の評価は、DuCCAEがエージェント実行の信頼性と対話品質を向上させつつ、リアルタイム予算に適合するための遅延を低減することを示しており、2025年6月以降の7日間リテンションは34.2%、複雑タスク完遂率は65.2%に達しています。
- 本研究は、産業界でスケーラブルなエージェント系システムを展開する際の実践的なガイドラインを提供します。