信頼できるコンテンツ推薦のための全空間反事実学習

arXiv stat.ML / 2026/3/26

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文はレコメンドシステムにおけるポストクリックCVR推定を扱い、データの疎さとサンプル選択バイアスを主要な障害として強調している。
  • 従来の全空間マルチタスク手法を、2つの問題点から批判している:本質的な推定バイアス(CVRの過大推定)と、誤った独立性の事前仮定(クリックとその後のコンバージョンの間に因果的な依存関係が欠落していること)。
  • 著者らは、ESMMに反事実リスク最小化器を追加してCVR推定を正則化する、モデル非依存の枠組みであるEntire Space Counterfactual Multitask Model(ESCM$^2$)を提案する。
  • 大規模な産業用データセットおよびオンラインの産業用レコメンデーションサービスでの実験により、ESCM$^2$はIEBとFIPの両方を低減し、全体の推薦性能を向上させることが示されている。

Abstract

クリック後のコンバージョン率(CVR)推定は、効果的なレコメンドシステムを開発する上での基本的な課題ですが、データの疎性やサンプル選択バイアスによって困難に直面しています。これら2つの課題の両方に対処するために、空間全体のマルチタスクモデルを用いてユーザ行動の軌跡を、露出 ightarrow クリック ightarrow コンバージョンの一連の流れに分解し、CVR推定のための代理的な学習タスクを構築します。しかし、これらの手法には2つの重大な欠点があります。(1)本質的推定バイアス(IEB)。ここではCVR推定値が実際の値よりも高くなります。(2)誤った独立性事前(FIP)。ここでは、クリックとそれに続くコンバージョンの因果関係が見落とされる可能性があります。これらの制約を克服するために、モデルに依存しない枠組み、すなわち Entire Space Counterfactual Multitask Model(ESCM^2)を提案します。これは、ESMMフレームワーク内に反実仮想リスク最小化器を組み込み、CVR推定を正則化します。大規模な産業用レコメンドデータセットおよびオンラインの産業用レコメンドサービス上で実施した実験により、ESCM^2がIEBとFIPの欠陥を効果的に緩和し、レコメンド性能を大幅に向上させることが示されました。