要旨: 多元的なアラインメント(整合)は、大規模言語モデル(LLM)を、個人や少数派グループの多様な嗜好へ適応させるために不可欠である。しかし、既存の手法はしばしば、安定した個人的特性とエピソード固有の要因を混在させてしまい、その結果、エピソードをまたいだ一般化能力が制限される。 この課題に対処するために、我々はエピソードとパーソナの明示的な結合のための枠組みであるEpiPersonaを提案する。 EpiPersonaはまず、ノイズを含む嗜好フィードバックを低次元のパーソナ空間へ投影し、そこで類似したパーソナを共有される離散コードへ集約する。 この過程により、事前に定義された嗜好の次元に依存することなく、持続的な個人的特徴と状況に固有なシグナルを分離する。 推論されたパーソナ表現はその後、現在のエピソードと結合され、エピソードを考慮した嗜好予測が可能となる。 広範な実験の結果、EpiPersonaは一貫してベースラインを上回ることが示された。 特に、困難なエピソードのシフトが起きる状況で顕著な性能向上を達成し、さらに嗜好データが乏しい場合でも有効である。
EpiPersona:人格(Persona)投影とエピソード結合による多元的嗜好モデリング
arXiv cs.AI / 2026/3/31
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLMの嗜好モデリングにおいて、持続的な個人の特性とエピソード固有の要因を分離することで、多元的アラインメントを実現するフレームワーク「EpiPersona」を提案する。
- EpiPersonaは、ノイズを含む嗜好フィードバックを低次元のパーソナ空間へ投影し、事前に定義された嗜好次元に依存しないために、類似した人格を共有する離散コードへ集約する。
- 次に、推論された人格表現を現在のエピソードと結合し、エピソードを考慮した嗜好予測を可能にする。
- 実験結果より、EpiPersonaは既存のベースラインよりも優れており、とりわけ困難なエピソード・シフト設定で大きな改善を示す。さらに、嗜好データが疎な状況でも良好に機能する。



