広告

Salesforce AI Research、VoiceAgentRAGを発表:デュアルエージェントのメモリルータによりボイスRAGの検索レイテンシを316倍削減

MarkTechPost / 2026/3/30

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • Salesforce AI Researchは、自然な会話における約200msの応答時間予算を満たすことを目的とした、音声に特化したRetrieval-Augmented Generation(RAG)アプローチ「VoiceAgentRAG」を発表しました。
  • 本システムはデュアルエージェントの「メモリルータ」を用いることで、検索/メモリのクエリをより適切に選択またはルーティングし、一般的なベクタデータベースによる問い合わせ手法と比べてボイスRAGの検索レイテンシを316倍削減します。
  • この取り組みは、ボイスアシスタントにおける重要なボトルネック、すなわちテキストチャットでは許容される一方で、リアルタイム音声インタラクションでは問題となるベクタ検索レイテンシを対象としています。
  • LLMの生成ループ全体だけでなく検索ステップを最適化することで、VoiceAgentRAGは、実運用の音声AIデプロイメントにおいて知覚される応答性と会話品質を改善することを狙います。

音声AIの世界では、役に立つアシスタントと気まずいやり取りの違いはミリ秒単位で測られます。テキストベースのRetrieval-Augmented Generation(RAG)システムなら、数秒の「思考」時間を確保することも可能ですが、音声エージェントは自然な会話の流れを維持するために、200msの予算内で応答する必要があります。一般的なプロダクション向けベクトルデータベースのクエリでは、通常 […]

この記事 Salesforce AI Research Releases VoiceAgentRAG: A Dual-Agent Memory Router that Cuts Voice RAG Retrieval Latency by 316x は初めてMarkTechPostに掲載されました。

広告