LOLGORITHM: 短尺動画向けの面白いコメント生成エージェント

arXiv cs.CV / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • LOLGORITHMは、短尺動画向けにプラットフォーム固有の文化・言語ノルムに沿った「本物っぽい」コメントを生成するための、モジュラーなマルチエージェント方式を提案している。
  • フレームワークは、(1)動画内容の要約、(2)動画分類、(3)意味検索(semantic retrieval)と“hot meme augmentation”を用いたコメント生成という3つの中核モジュールで構成され、6種類のコメントスタイルを制御可能としている。
  • YouTubeとDouyin向けに二言語で構築した3,267本・16,335コメントのデータセットと、機械評価に加えて大規模な人間嗜好評価(107名)により、ベースラインより一貫して優れることが示された。
  • 人間選好率はYouTubeで80.46%、Douyinで84.29%であり、アブレーションにより改善が特定のバックボーンLLM選定ではなくアーキテクチャの寄与によるものだと確認されている。

要旨: 短尺動画プラットフォームは、マルチメディア情報の発信において中核的な存在となっており、コメントはエンゲージメントの促進、伝播、そしてアルゴリズム的なフィードバックにおいて重要な役割を担っています。しかし、既存の手法――動画要約やライブストリーミングのダンマク生成を含む――では、プラットフォーム固有の文化的・言語的規範に適合し、かつ真正性のあるコメントを生成することができません。本論文では、様式化された短尺動画向けコメント生成のための、新しいモジュール型マルチエージェント枠組みである LOLGORITHM を提案します。LOLOGORITHM は 6 種類の制御可能なコメントスタイルをサポートし、3 つの中核モジュールから構成されます。すなわち、(1) 動画コンテンツ要約、(2) 動画分類、(3) 意味検索とホットミーム拡張によるコメント生成です。さらに、YouTube と Douyin にまたがる 5 つの高いエンゲージメントカテゴリにわたる、3,267 本の動画と 16,335 件のコメントからなるバイリンガルデータセットを構築しました。自動スコアリングと大規模な人手による嗜好分析を組み合わせた評価により、LOLOGORITHM が一貫してベースライン手法を上回り、107 名の回答者において、YouTube では 80.46\%、Douyin では 84.29\% の人手による選好率を達成することが示されました。アブレーション研究により、これらの向上はバックボーン LLM の選択ではなく、枠組みのアーキテクチャに起因することが確認され、提案手法の頑健性と汎用性が裏づけられます。