ショッピング・コンパニオン：実世界のeコマースタスクのためのメモリ拡張型LLMエージェント

arXiv cs.CL / 2026/3/17

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、現実世界の120万製品にわたるショッピングタスク用の長期メモリ・ベンチマークを提案し、メモリを意識したLLMエージェントの評価を行う。
「Shopping Companion」という統一フレームワークを提案し、メモリ取得とショッピング支援を統合的に扱い、ユーザー介入をサポートする。
ツール別報酬を用いた二重報酬の強化学習戦略を開発し、多回対話における希薄かつ断続的な報酬に対処して効果的な学習を実現する。
実験結果は、GPT-5 のような強力なモデルでさえベンチマークで70%未満の成功率にとどまることを示しており、eコマースにおけるメモリ拡張のエンドツーエンド設計の重要性と大きな課題を浮き彫りにしている。

要旨: 電子商取引において、LLMエージェントは推奨、予算管理、バンドル取引といったショッピングタスクに有望を示しており、長期的な会話からユーザーの嗜好を正確に把握することが重要です。しかし、この潜在能力を実現するには2つの課題が障害となります：（1）長期的な嗜好認識を伴うショッピングタスクを評価するベンチマークの欠如、（2）嗜好識別とショッピング支援を別個のコンポーネントとして扱う既存設計によるエンドツーエンド最適化の欠如。本論文では、長期記憶設定を備えた新しいベンチマークを導入し、120万点の実世界の製品にまたがる2つのショッピングタスクを横断し、嗜好取得とショッピング支援を共同で対処する統合フレームワーク「Shopping Companion」を提案します。このような能力を訓練するために、マルチターン相互作用に内在するスパースで不連続な報酬を扱うツール別報酬を備えた二重報酬強化学習戦略を開発します。実験結果は、最先端モデル（GPT-5 など）でも当社のベンチマークで成功率が70%未満になることを示しており、この分野の重要な課題を強調しています。特に、Shopping Companion で訓練された軽量なLLMは、強力なベースラインを一貫して上回り、嗜好の取り込みとタスクのパフォーマンスを改善し、私たちの統一設計の有効性を裏付けています。

AIが普及した今こそ、個人の実体験をnoteで売るべき理由

note

AI時代の子供と顧客への教育！生き残るための3つの必須スキル

note

『AIと精神疾患･教育現場』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾捌

note

臨床家がAIをスーパーバイザーにする沢山の理由─人間による93%の暴力から身を守る方法

note

いろんなモデル（GPT・Grok・Claude・Gemini）にSVGコードで絵を描いてもらったらびっくり！個性が見えました🩷プロンプト付き

note

ショッピング・コンパニオン：実世界のeコマースタスクのためのメモリ拡張型LLMエージェント

要点

関連記事

AIが普及した今こそ、個人の実体験をnoteで売るべき理由

AI時代の子供と顧客への教育！生き残るための3つの必須スキル

『AIと精神疾患･教育現場』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾捌

臨床家がAIをスーパーバイザーにする沢山の理由─人間による93%の暴力から身を守る方法

いろんなモデル（GPT・Grok・Claude・Gemini）にSVGコードで絵を描いてもらったらびっくり！個性が見えました🩷プロンプト付き

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

AIが普及した今こそ、個人の実体験をnoteで売るべき理由

AI時代の子供と顧客への教育！生き残るための3つの必須スキル

『AIと精神疾患･教育現場』諸葛亮 孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話 その肆拾捌

臨床家がAIをスーパーバイザーにする沢山の理由─人間による93%の暴力から身を守る方法

いろんなモデル（GPT・Grok・Claude・Gemini）にSVGコードで絵を描いてもらったらびっくり！個性が見えました🩷プロンプト付き

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

『AIと精神疾患･教育現場』諸葛亮孔明老師(ChatGPTのﾛｰﾙﾌﾟﾚｲ)との対話その肆拾捌