要旨: 逐次推薦(SR)タスクは、ユーザの過去の行動履歴に基づいて次のアイテムを予測することを目的とする。通常、SRモデルは過去データで学習されるが、分布の乖離やパラメータ化された制約によって引き起こされる困難のため、推論時の実時間における嗜好の変化に適応するのが難しいことが多い。この問題に対処する既存手法には、テスト時学習、テスト時オーグメンテーション、検索拡張による微調整などがある。しかし、これらの方法は、いずれも大きな計算オーバーヘッドを導入するか、ランダムなオーグメンテーション戦略に依存するか、慎重に設計された二段階の学習パラダイムを必要とする。本論文では、有効なテスト時適応の鍵は「効果的なオーグメンテーション」と「効率的な適応」の両立にあると主張する。そこで本研究では、Retrieve-then-Adapt(ReAd)と呼ぶ新しい枠組みを提案し、取得したユーザ嗜好の信号を通じて、テスト分布に動的に適応することで、配備済みのSRモデルを適応させる。具体的には、学習済みのSRモデルが与えられたとき、ReAdはまず、構築した協調メモリデータベースから、テストユーザに対して協調的に類似したアイテムを検索する。次に、軽量な検索学習モジュールが、これらのアイテムを、協調的な信号と予測の改善(refinement)の手がかりの両方を捉える有益なオーグメンテーション埋め込みへと統合する。最後に、この埋め込みを取り込む融合メカニズムにより、初期のSR予測を洗練する。5つのベンチマークデータセットにまたがる大規模な実験の結果、ReAdは既存のSR手法に対して一貫して優れた性能を示すことが確認された。
Retrieve-then-Adapt:連続レコメンデーションにおける検索拡張型テスト時適応
arXiv cs.LG / 2026/4/8
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ユーザーの嗜好が学習時の分布から変化した際に、推論時に適応できない連続レコメンデーションモデルを対象に研究する。
- そこで提案するのがRetrieve-then-Adapt(ReAd)であり、共同フィルタリングに類似したアイテムを、共同メモリデータベースからテストユーザーについて検索し、ユーザー嗜好のシグナルを取得する。
- ReAdは軽量な検索学習モジュールを用いて、検索されたアイテムを拡張(augmentation)埋め込みへ変換し、共同情報と予測の洗練(refinement)を促す手がかりを組み合わせる。
- 続いて、この枠組みは融合(fusion)メカニズムにより拡張埋め込みを取り込み、初期の次アイテム予測を洗練し、重い計算を増やさずに有効性を高めることを目指す。
- 5つのベンチマークデータセットでの実験により、ReAdは連続レコメンデーションにおけるテスト時適応について、従来手法に対して一貫して優れた性能を示す。




