マルチビュー・メディア・プロファイリング・スイート：リソース、評価、分析

arXiv cs.CL / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本研究は、政治的バイアスの検出や事実性評価のためのマルチビュー・メディア・プロファイリング手法を提案し、統一的なデータセット不足や多様なアプローチにわたる包括的評価、表現と融合戦略の系統的分析といった課題に取り組みます。
MBFC-2025として、Media Bias/Fact Check（MBFC）から約2,600のニュースアウトレットをカバーする大規模なラベルセットを新たに導入します。
ACL-2020（約900アウトレット）およびMBFC-2025の双方に対して、Alexaグラフ、ハイパーリンクグラフ、LLM由来グラフ、記事、Wikipedia記述といった複数のモダリティを用いたマルチビュー表現を構築します。
埋め込みビューと融合戦略を体系的に比較し、強化学習ベースの融合変種も含めて検証したうえで、大規模実験を行いACL-2020での最先端性能と、MBFC-2025での強力なベンチマークを示します。

要旨: ニュースメディアは、政治的バイアスや事実性を自動的に検出することが不可欠になるほどの規模で世論を形成する。しかし、この分野には、統一されたリソース、多様なアプローチにまたがる包括的な評価、特にラベルの疎らさやデータセットの多様性の下で最も重要となる表象と融合戦略に関する体系的な分析が依然として欠けている。さらに、「一貫して機能するもの」「失敗するもの」「その理由」を、観察に基づいて広範に報告する実証的研究もほとんどない。これらのギャップに対し、我々は主に4つの貢献によって取り組む。第一に、Media Bias/Fact Check（MBFC）から約2,600のアウトレットをカバーする大規模ラベル集合MBFC-2025を導入する。第二に、ACL-2020（Panayotov et al., 2022）に対して（約900アウトレットを含む）およびMBFC-2025に対して、多視点表象を構築する。これらの表象は、Alexaグラフ、ハイパーリンクグラフ、LLMにより導出されたグラフ、記事、およびWikipediaの記述にまたがる。第三に、埋め込み視点（embedding views）と融合戦略について、強化学習に基づく融合の変種を含めて、体系的な評価と分析を行う。第四に、ACL-2020において最先端の結果を達成し、MBFC-2025上で強力なベンチマークを確立する大規模な実験を実施する。