議論構造を活用したコンテンツのヘイト性予測

arXiv cs.CL / 2026/5/5

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、議論の構造（前提と結論）が、情報ディスオーダーに関与するオンライン内容の全体的なヘイト性を予測するのに役立つ可能性を検討します。
WSF-ARG+データセットを用い、白人至上主義フォーラムのメッセージに対して議論構造のラベルが付与されていることを活用します。
個々の議論構成要素に対するチェック可能性（checkworthiness）とヘイト性の注釈を利用し、メッセージ全体のヘイト性を推定します。
結果は有望で、最大96%のF1が報告されており、このアプローチをヘイトスピーチ検出や情報ディスオーダー対策へ拡張できる可能性が示唆されます。
著者らは、議論構造に基づく共通の手がかりを通じて、情報ディスオーダー問題の異なる側面を結びつけることで、より包括的な解決策につながり得ると提案しています。

要旨: 情報の混乱は、社会全体に影響を及ぼす難しい現象である。この現象には、オンライン上で誤解を招く情報、誤った情報、そして憎悪に満ちたコンテンツが拡散されることが含まれる。異なる文脈では、問題のある一側面が優勢になる場合もあるが、全体としてこれは幅広い問題であり、包括的な解決策が必要である。問題の各側面（ヘイトスピーチ、デマ、誤情報など）はそれぞれ深い分析を要する一方で、本論文では、これらの異なる領域を結びつけるための関連情報を提供する手段として、議論構造の可能性に着目する。具体的には、白人至上主義フォーラムのメッセージを議論構造（前提と結論）の観点から注釈付けしたWSF-ARG+データセットに焦点を当てる。そこで我々は、議論構成要素の「検証可能性（checkworthiness）」と「憎悪性（hatefulness）」の注釈を活用し、メッセージ全体の憎悪性に関する洞察を得る。結果は有望な洞察を示しており（最大96%のF1）、将来的にこの方向性を発展させ、憎悪に満ちたコンテンツの識別や情報の混乱への対抗に取り組める可能性が示唆される。