TRACEに従え:オンライン遅延CVR予測におけるポストクリック軌跡の活用

arXiv cs.LG / 2026/4/28

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、オンラインのコンバージョン率(CVR)予測における遅延フィードバックの課題を扱っており、ラベル精度と新鮮なデータ利用の間のトレードオフが生じることを示しています。
  • 提案手法TRACEでは、観測期間にわたるクリック後行動の変化を「フィードバック軌跡」としてモデル化し、最終結果を待つのではなく、蓄積されたフィードバック状態の対応度に基づいて転換(コンバージョン)事後確率を更新します。
  • TRACEは未開示のサンプルに対してハードなラベルを押し付けず、フィードバックが到着するにつれて予測を動的に改善できるようにしています。
  • さらに、軌跡の観測が初期段階でスパースになりがちな問題に対し、信頼度でゲートされたレトロスペクティブ・コンプリータを導入し、ライフサイクル全体のデータを用いて未開示サンプルの事後確率を適応的にガイドします。
  • 実験によりTRACEが既存の最先端ベースラインより優れていること、またレトロスペクティブ・コンプリートがモデルに依存しない形で既存システムを強化することが確認されています。

Abstract

遅延フィードバックは、オンラインCVR予測における中核的な課題であり、ラベルの正確さとデータの新鮮さの間のトレードオフを強いる。既存手法は、遅延モデリングまたはサンプルの再重み付けによってこの問題に対処しているが、観測期間を通じてクリック後の行動がどのように変化するかは見過ごされている。これを克服するために、本研究ではこの変化をフィードバック軌跡として形式化し、TRACEを提案する。未開示のサンプルに対して強いラベル(ハードラベル)を押し付けるのではなく、蓄積されたフィードバック状態が、コンバージョンか非コンバージョンかのどちらとどれだけ整合しているかを評価し、最終結果を待つことなく事後分布(ポステリア)を動的に洗練する。初期段階における軌跡の疎性に対抗するために、さらに、ライフサイクル全体のデータを活用して、未開示サンプルに対して適応的な事後分布のガイダンスを提供する、信頼性ゲート付きの回顧的コンプリータも設計する。大規模な実験により、TRACEが最先端のベースラインに対して優れていることを検証し、また回顧的完結モジュールが既存システムに対するモデル非依存の強化(enhancer)であることを確認する。コードは https://github.com/LunaZhangxy/TRACE で公開している。