KARMA:Taobaoにおけるパーソナライズ検索のための、知識・行動正則化マルチモーダルアラインメント
arXiv cs.LG / 2026/3/26
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLMを用いたパーソナライズ検索の微調整において、「知識—行動ギャップ(Knowledge–Action Gap)」を特定する。具体的には、パーソナライズされた行動に最適化すると、事前学習で獲得した意味知識の保持と衝突しうる点である。
- 行動のみの学習目的は、「意味崩壊(Semantic Collapse)」を引き起こし得ることを報告する。これには注意(attention)の「シンク(sink)」が含まれ、パーソナライズ検索の汎化性能を損なう。
- 著者らはKARMA(Knowledge–Action Regularized Multimodal Alignment)を提案する。これは、意味再構成を学習時の正則化として用いることで意味知識を維持しつつ、検索指向の次の関心埋め込み(retrieval-oriented next-interest embeddings)を最適化する枠組みである。
- KARMAは、学習中に意味復号可能性(semantic decodability)を維持するために、補完的な2つの制約—履歴条件付き意味生成と、埋め込み条件付き意味再構成—を用いる。
- Taobaoでの実験により、KARMAは意味崩壊を軽減し、ランキングおよび検索指標を改善することが示される。例えば、意味復号可能性による最大+22.5 HR@200 や、推論時オーバーヘッドが小さい状況でのオンライン展開結果として+0.5% Item Clickが報告されている。