要旨: レビューはオンラインマーケットプレイスで旅行者が製品を評価する上で中心的な役割を果たしますが、既存の要約研究は往々にしてエンドツーエンドの品質を強調する一方で、ベンチマークの信頼性や粒度の洞察の実用性を見落としがちです。これに対処するため、私たちは MOSAIC を提案します。産業展開を想定したスケーラブルでモジュール式のフレームワークであり、要約を解釈可能な構成要素に分解します。これにはテーマ発見、構造化された意見抽出、根拠付き要約生成が含まれます。私たちはオンラインの A/B テストを通じてアプローチの実用的影響を検証し、ライブの製品ページ上で中間的な出力を提示することが顧客体験を改善し、完全な要約展開前でも測定可能な価値をもたらすことを示します。さらに、要約の強力なベースラインと比較して MOSAIC が優れたアスペクト網羅性と忠実度を達成することを示す広範なオフライン実験を実施します。重要な点として、システムレベルのコンポーネントとして意見クラスタリングを導入し、それが忠実度を著しく高めることを示します。特に、ユーザーレビューに典型的なノイズと冗長性のある条件下で効果を発揮します。最後に、標準的な SPACE データセットの信頼性の限界を特定し、より頑健な評価を可能にする新しいオープンソースのツアー体験データセット TRECS を公開します。
MOSAIC: アスペクト識別とクラスタリングを用いたモジュラー意見要約
arXiv cs.LG / 2026/3/23
📰 ニュースTools & Practical UsageModels & Research
要点
- MOSAICは、解釈性と実運用展開を向上させるため、タスクをテーマ発見、構造化された意見抽出、根拠ある要約生成の3段階に分解する、スケーラブルでモジュラーな意見要약フレームワークである。
- MOSAICは、実運用中の製品ページに対するオンラインA/Bテストで検証されており、中間出力を提示することが、完全導入前の顧客体験を改善し、測定可能な価値を提供できることを示している。
- オフラインの実験は、要約において強力なベースラインと比較して、アスペクトの網羅性と忠実性においてMOSAICが優れていることを示している。
- 本研究は、意見クラスタリングをシステムレベルのコンポーネントとして導入し、ノイズが多く冗長なユーザーレビューの下で忠実性に対する顕著な影響を示している。
- 著者らはSPACEデータセットの信頼性に関する限界を指摘し、より堅牢な評価を可能にする新しいオープンソースのツアー体験データセット TRECS を公開している。