ダイナミックな個別嗜好を実現:ペア化したファインチューニングによる対立する人間の価値の解決

arXiv cs.CL / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 論文では、多様で矛盾し、かつ時間とともに変化する嗜好を持つ個人向けにLLMをパーソナライズするための「Preference-Paired Fine-Tuning(PFT)」を提案する。
  • 人間の嗜好が対立するシナリオを収録した新しい評価データセット「Value Conflict Dilemma(VCD)」を導入し、モデルがトレードオフをどれだけ適切に扱えるかを検証する。
  • 実験の結果、PFTは単一嗜好での学習より性能が向上し、DPOやSFTを含む手法よりも優れている。マルチ選択分類で最大96.6%の精度を達成し、オープンエンド生成では8.69のスコアを得る。
  • ユーザ履歴が限られている場合でも、PFTはユーザ固有の嗜好ベクトルを素早く推定でき、単一嗜好モデルに対してアライメントが44.76%改善する。
  • 全体として、本研究は、対立を解消するためのペア化された嗜好シグナルを用いた、構造化されたファインチューニング問題として嗜好パーソナライズを位置づけている。