HotComment：オンラインコメントの人気度を評価するためのベンチマーク

arXiv cs.AI / 2026/4/29

📰 ニュースModels & Research

共有:

要点

本論文は、動画とテキストを統合したマルチモーダルのベンチマーク「HotComment」を提案し、オンラインコメントの人気度をより包括的に測定することを目指しています。
評価は3つの拡張要素に分解されます。すなわち、Content Quality（人間のグラウンドトゥルースとの意味的類似に基づき、解釈可能な複数の次元で品質を評価）、Popularity Prediction（実世界の相互作用データから学習したトレンドに基づく予測）、User Behavior Simulation（エージェントベースでプラットフォーム利用者の分布をモデル化し、engagement scoreを近似）です。
プラットフォームやコミュニティごとのスタイル嗜好の違いを扱うために、社会的なリップル効果に着想したStyleCmtを提案し、多面的なスタイルを整合させて社会的に共鳴する表現を増幅し、不適合な表現を抑制します。
どのコメントが人気になるかは、言語的品質、感情的な響き、コミュニティ固有のスタイル嗜好が組み合わさって決まるという点を、より適切に捉えることがベンチマークの狙いです。

Abstract

オンラインコメントは、ソーシャルメディアにおける世論や意見のダイナミクスを形成する上で重要な役割を果たします。しかし、その人気度の評価は難しいままです。これは、言語的な質、独自性、感情的な共鳴に依存することに加え、プラットフォームやユーザー集団によってスタイル上の嗜好が大きく異なり、同じコメントであっても異なるコミュニティでは響き方が変わるためです。本研究では、動画とテキストのモダリティを統合したマルチモーダル・ベンチマークであるHotCommentを提案します。これにより、人気度を3つの強化された観点から包括的に定量化します。 (1) コンテンツ品質：正解となる人間コメントとの意味的類似度を評価し、さらに4つの解釈可能な次元を通じて品質評価を拡張します。 (2) 人気予測：実世界の相互作用データで訓練されたモデルに基づくトレンドから導きます。 (3) ユーザー行動シミュレーション：プラットフォーム利用者の分布をモデル化し、エージェントベースの枠組みによって extbf{エンゲージメントスコア} を近似します。さらに本研究では、ソーシャルな波及効果に着想を得たStyleCmtを提案します。複数のスタイル次元を整合させることで、社会的に共鳴する表現を増幅し、整合しない表現を抑制します。