再簿価バイアスから安定した収束へ:マッチメイキング応用におけるオンライン嗜好学習のためのブロック・カッチマルツ法
arXiv cs.LG / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、相互型レコメンダシステムにおけるリアルタイムのパーソナライズされたマッチメイキングのための、カッチマルツ法に基づくオンライン嗜好学習アルゴリズムを提案する。
- カッチマルツに着想を得たオンライン学習器で用いられる事後ステップのL2正規化が、指数関数的な鮮度(recency)バイアスを生み、古い相互作用はわずかなスワイプ数の後に実質的に消失してしまうことを示す。
- これに対処するため、著者らは正規化ステップを、ステップサイズを解析的に上界づけつつ相互作用履歴を保持する、チホノフ正則化付き射影の分母に置き換える。
- さらに、候補タグベクトルが事前に正規化されていない場合に対応する適応的な変種も提案しており、||a||^2 + alpha の分母により候補ごとのステップサイズを算出する。
- 大規模シミュレーション(6,400スワイプ)では、BlockNK がラベルノイズ下で最良の嗜好整合性と方向安定性を達成すると報告され、候補のフィルタリングは漸近的な整合性を改善しうる一方で、フィードバックループのリスクを追加する可能性がある。

