EpiPersona：人格（Persona）投影とエピソード結合による多元的嗜好モデリング

arXiv cs.AI / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、LLMの嗜好モデリングにおいて、持続的な個人の特性とエピソード固有の要因を分離することで、多元的アラインメントを実現するフレームワーク「EpiPersona」を提案する。
EpiPersonaは、ノイズを含む嗜好フィードバックを低次元のパーソナ空間へ投影し、事前に定義された嗜好次元に依存しないために、類似した人格を共有する離散コードへ集約する。
次に、推論された人格表現を現在のエピソードと結合し、エピソードを考慮した嗜好予測を可能にする。
実験結果より、EpiPersonaは既存のベースラインよりも優れており、とりわけ困難なエピソード・シフト設定で大きな改善を示す。さらに、嗜好データが疎な状況でも良好に機能する。

要旨: 多元的なアラインメント（整合）は、大規模言語モデル（LLM）を、個人や少数派グループの多様な嗜好へ適応させるために不可欠である。しかし、既存の手法はしばしば、安定した個人的特性とエピソード固有の要因を混在させてしまい、その結果、エピソードをまたいだ一般化能力が制限される。この課題に対処するために、我々はエピソードとパーソナの明示的な結合のための枠組みであるEpiPersonaを提案する。 EpiPersonaはまず、ノイズを含む嗜好フィードバックを低次元のパーソナ空間へ投影し、そこで類似したパーソナを共有される離散コードへ集約する。この過程により、事前に定義された嗜好の次元に依存することなく、持続的な個人的特徴と状況に固有なシグナルを分離する。推論されたパーソナ表現はその後、現在のエピソードと結合され、エピソードを考慮した嗜好予測が可能となる。広範な実験の結果、EpiPersonaは一貫してベースラインを上回ることが示された。特に、困難なエピソードのシフトが起きる状況で顕著な性能向上を達成し、さらに嗜好データが乏しい場合でも有効である。