OmniTrend:スケーラブルなソーシャル人気予測のためのコンテンツ・コンテキストモデリング

arXiv cs.CV / 2026/4/30

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ソーシャルメディアの人気予測では、コンテンツの本質的な魅力と、外部の露出(露出文脈)を同時に捉える必要があると主張しています。
  • OmniTrendでは、コンテンツ魅力度と文脈的な露出を分離して学習することで、表現がプラットフォーム特有の可視性バイアスを取り込む問題を避けます。
  • コンテンツ側のモジュールは、視覚・音声・テキストのマルチモーダル手がかりから表現を学習し、本質的な魅力を定量化します。
  • 文脈側のモジュールは、投稿時間、投稿者の活動量、トピックのトレンド、リトリーバルに基づく近傍統計といった外生的シグナルから露出を推定します。
  • コンテンツ魅力度と露出を別々の予測器として統合し最終的な人気度を推定することで、解釈可能性と画像・動画をまたぐクロスプラットフォーム転移の頑健性を高めます。

要旨: ソーシャルメディアの人気を予測するには、コンテンツそのものの本質的な魅力と、それがユーザにどのように露出されるかを決める外部の文脈の両方を理解する必要がある。既存の手法はコンテンツのシグナルに焦点を当てているが、それらを露出に関係するパターンから切り離していないため、学習された表現がプラットフォーム固有の可視性効果を取り込み、解釈可能性とクロスプラットフォームでの転移の両方が弱まる。本論文では、コンテンツの魅力と文脈上の露出の双方の共同の結果として人気をモデル化する統一フレームワーク OmniTrend を提案する。コンテンツ・モジュールは、視覚、音声、テキストの手がかりからクロスモーダル表現を学習し、本質的な魅力を定量化する。一方、コンテキスト・モジュールは、投稿時刻、投稿者の活動、トピックのトレンド、検索に基づく近傍統計といった外生的シグナルから露出を推定する。OmniTrend は、コンテンツの魅力と文脈上の露出それぞれに対する独立した予測器を学習し、それらを最終的な人気の推定に統合することで、各要因の役割を明示し、画像・動画プラットフォーム間で頑健な転移を可能にする。