PeReGrINE:ユーザ・アイテムグラフ文脈によるパーソナライズされたレビュー忠実度の評価

arXiv cs.CL / 2026/4/10

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • PeReGrINEは、グラフ構造化されたユーザ–アイテムの根拠を用い、明示的な時間的カットオフ制約を持ってパーソナライズされたレビューを生成するための新しいベンチマークおよび評価フレームワークである。
  • この手法はAmazon Reviews 2023を時間的に整合する二部グラフへと再構成し、各対象レビューをユーザ履歴、アイテム文脈、近傍(近い)相互作用から得られる、上限付きの根拠に基づいて条件付けする。
  • 生の履歴が疎である場合でも持続的な嗜好を捉えるために、過去のレビューからユーザの言語的・情動的な傾向を要約する「User Style Parameter(ユーザスタイルパラメータ)」を計算する。
  • 4つの検索根拠設定(プロダクトのみ、ユーザのみ、近傍のみ、そして両方の結合)にわたる制御された比較を可能にし、さらに「Dissonance Analysis(不一致分析)」を追加して、ユーザのスタイルとプロダクトレベルの合意とのズレを測定する。
  • 本研究では、補助的文脈として視覚的根拠も検証し、いくつかの状況ではテキストの品質が改善し得ることを示す。一方で、グラフ由来の根拠がパーソナライズ性と一貫性の主な駆動要因である。

Abstract

本稿では、グラフ構造化されたユーザ—アイテムの根拠に基づくパーソナライズドなレビュー生成のためのベンチマークおよび評価フレームワークであるPeReGrINEを提案する。PeReGrINEはAmazon Reviews 2023を時間的に整合的な二部グラフへ再構成し、各ターゲットレビューが、ユーザ履歴からの有界な根拠、アイテムの文脈、および明示的な時間カットオフのもとでの近傍(近傍相互作用)からの影響に条件付けられるようにする。疎な生の履歴に直接条件付けすることなく、ユーザの嗜好の持続性を表現するために、各ユーザの言語的・情動的な傾向を過去のレビューにわたって要約するUser Style Parameterを計算する。この設定により、グラフに由来する4つの検索設定――製品のみ、ユーザのみ、近傍のみ、結合された根拠――の制御された比較が可能になる。標準的な生成指標に加えて、期待されるユーザスタイルや製品レベルでのコンセンサスからの逸脱を測定するマクロレベルの評価フレームワークとしてDissonance Analysisを導入する。また、補助的な文脈ソースとして視覚的根拠も検討し、いくつかの設定ではそれがテキストの品質を改善し得る一方で、パーソナライズと整合性を主に駆動するのはグラフに由来する根拠であることを見いだす。製品カテゴリをまたいで、PeReGrINEは、根拠の構成が、レビューの忠実性、パーソナライズ、および検索条件付き言語モデルにおける根拠づけにどのように影響するかを研究するための再現可能な方法を提供する。