この投稿は、研究課題としての質問として公開しているもので、他に見落としている先行研究があるかを知りたいという意図です。
ECサイトの推奨システムにおいて、主要な信号は閲覧行動、セッションデータ、明示的な評価、プラットフォーム内の購買履歴です。これらはノイズが多く、セッションに束縛され、小売業者ごとにサイロ化されています。
私の理解では存在しないもの:購買後のアウトカムの正規化された小売業者横断データセット。具体的には、ユーザーが何を購入し、何を保持し、何を返品し、別のものに置き換え、再購入したか。これは好み学習の真の信号(ground-truth signal)ですが、中立的な形で大規模に組み立てられたことはありません。
難しい理由:
- 各小売業者は異なる製品スキーマを使用しているため、1kを超える小売業者間での正規化は容易ではない
- 購買後の信号には縦断データが必要で、セッションデータではない
- 小売業者は互いに、または中立的なインフラとデータを共有するインセンティブがない
この取り組みには、メール注文データを介してこれらのアウトカムを捕捉する取り込み・正規化パイプラインを構築してきました。システムはアウトカムを分類し、メモリを照会可能にします。
本音の質問:
- 知っておくべき横断小売業者購買後アウトカムモデリングの学術文献はありますか?
- 唯一の信頼できる信号が縦断的かつスパースな場合、どのように好み学習に取り組みますか?
- 数百の小売業者にまたがるような、異種の製品データを正規化するための適切なアーキテクチャは何ですか?
特に宣伝するつもりはありません。単にこれが既知の難問かどうか、そして人々がどのようなアプローチを試してきたかに興味があるだけです。
[リンク] [コメント]
