YouTube Shortsにおけるイスラエル・ハマス戦争の官製ニュース報道のマルチモーダル分析

arXiv cs.CL / 2026/4/3

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、YouTube Shorts向けのマルチモーダル分析パイプラインを提案しており、これには自動文字起こし、アスペクトベースの感情分析(ABSA)、セマンティックなシーン分類を組み合わせる。
  • 本パイプラインの実行可能性を評価したのち、官製放送局によるイスラエル・ハマス戦争関連の2,300本超のコンフリクト関連Shortsと、94,000枚超の映像フレームに適用する。
  • 結果として、文字起こしにおける感情は報道機関間で異なり、特定のアスペクトによって時間とともに変化する一方で、シーンタイプの分類は、現実の出来事と整合する映像上の手がかりに一致することが示される。
  • 本研究では、小規模なドメイン適応モデルが、感情分析において大規模トランスフォーマーやさらにはLLMよりも優れていることを見出しており、人文学領域におけるリソース効率の高いアプローチの有効性が強調される。
  • 著者らは、アルゴリズムによる動画環境が感情や視覚的シグナルをどのように符号化するかを、他のショートフォーム・プラットフォーム(例:TikTok、Instagram)でも研究できるように、パイプラインを再利用可能なテンプレートとして提示している。

概要: YouTube Shorts は、プラットフォーム上でのニュース消費の中核になっていますが、このフォーマットにおいて地政学的な出来事がどのように表象されるのかに関する研究は限定的です。このギャップに対処するため、我々は自動文字起こし、アスペクトベースのセンチメント分析(ABSA)、およびセマンティックなシーン分類を組み合わせたマルチモーダル・パイプラインを提示します。まず、このパイプラインの実現可能性を評価し、その後、官費によって支援された媒体によるイスラエル・ハマス戦争の短尺コンテンツの報道を分析するために適用します。2,300本超の紛争関連 Shorts と 94,000 枚超の視覚フレームを用いて、主要な国際放送局における戦争報道を体系的に検討します。その結果、特定のアスペクトに関するトランスクリプト上の表明センチメントは、媒体間および時期をまたいで異なる一方で、シーンタイプの分類は現実の出来事と整合的な視覚的手がかりを反映することが分かりました。特に、小規模なドメイン適応モデルが、センチメント分析において大規模トランスフォーマーやさらには LLM よりも優れており、人文学研究において資源効率の高いアプローチの価値が裏づけられます。このパイプラインは、TikTok や Instagram のような他の短尺プラットフォームのためのテンプレートとして機能し、マルチモーダル手法を、定性的な解釈と組み合わせることで、アルゴリズム駆動型の動画環境におけるセンチメントのパターンおよび視覚的手がかりを特徴づけられることを示します。