AI Navigate

ショッピング・コンパニオン:実世界のeコマースタスクのためのメモリ拡張型LLMエージェント

arXiv cs.CL / 2026/3/17

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、現実世界の120万製品にわたるショッピングタスク用の長期メモリ・ベンチマークを提案し、メモリを意識したLLMエージェントの評価を行う。
  • 「Shopping Companion」という統一フレームワークを提案し、メモリ取得とショッピング支援を統合的に扱い、ユーザー介入をサポートする。
  • ツール別報酬を用いた二重報酬の強化学習戦略を開発し、多回対話における希薄かつ断続的な報酬に対処して効果的な学習を実現する。
  • 実験結果は、GPT-5 のような強力なモデルでさえベンチマークで70%未満の成功率にとどまることを示しており、eコマースにおけるメモリ拡張のエンドツーエンド設計の重要性と大きな課題を浮き彫りにしている。

要旨: 電子商取引において、LLMエージェントは推奨、予算管理、バンドル取引といったショッピングタスクに有望を示しており、長期的な会話からユーザーの嗜好を正確に把握することが重要です。しかし、この潜在能力を実現するには2つの課題が障害となります:(1)長期的な嗜好認識を伴うショッピングタスクを評価するベンチマークの欠如、(2)嗜好識別とショッピング支援を別個のコンポーネントとして扱う既存設計によるエンドツーエンド最適化の欠如。 本論文では、長期記憶設定を備えた新しいベンチマークを導入し、120万点の実世界の製品にまたがる2つのショッピングタスクを横断し、嗜好取得とショッピング支援を共同で対処する統合フレームワーク「Shopping Companion」を提案します。 このような能力を訓練するために、マルチターン相互作用に内在するスパースで不連続な報酬を扱うツール別報酬を備えた二重報酬強化学習戦略を開発します。 実験結果は、最先端モデル(GPT-5 など)でも当社のベンチマークで成功率が70%未満になることを示しており、この分野の重要な課題を強調しています。 特に、Shopping Companion で訓練された軽量なLLMは、強力なベースラインを一貫して上回り、嗜好の取り込みとタスクのパフォーマンスを改善し、私たちの統一設計の有効性を裏付けています。