Salesforce AI Research、VoiceAgentRAGを発表：デュアルエージェントのメモリルータによりボイスRAGの検索レイテンシを316倍削減

MarkTechPost / 2026/3/30

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

共有:

要点

Salesforce AI Researchは、自然な会話における約200msの応答時間予算を満たすことを目的とした、音声に特化したRetrieval-Augmented Generation（RAG）アプローチ「VoiceAgentRAG」を発表しました。
本システムはデュアルエージェントの「メモリルータ」を用いることで、検索／メモリのクエリをより適切に選択またはルーティングし、一般的なベクタデータベースによる問い合わせ手法と比べてボイスRAGの検索レイテンシを316倍削減します。
この取り組みは、ボイスアシスタントにおける重要なボトルネック、すなわちテキストチャットでは許容される一方で、リアルタイム音声インタラクションでは問題となるベクタ検索レイテンシを対象としています。
LLMの生成ループ全体だけでなく検索ステップを最適化することで、VoiceAgentRAGは、実運用の音声AIデプロイメントにおいて知覚される応答性と会話品質を改善することを狙います。

この記事の続きは原文サイトでお読みいただけます。