旗を理解する：検閲を超えてヘイトスピーチの文脈を捉える

arXiv cs.CL / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

オンライン・プラットフォームにおけるヘイトスピーチ検出は、削除や検閲を優先しがちで、透明性が下がり、なぜ危険なのかを説明しにくいという懸念があります。
本論文では、LLMと新しく作成・キュレーションした3つの語彙を組み合わせ、英語・フランス語・ギリシャ語でヘイトスピーチを検出し説明するハイブリッド手法を提案しています。
2つの補完的なパイプラインを用い、アイデンティティに結びつく問題語を特定・曖昧性を解消する経路と、集団を直接標的にする内容の文脈をLLMが評価する経路を組み合わせます。
出力は統合され、なぜフラグが立てられたのかを明確にする根拠付きの説明として提示されます。
人手評価の結果、LLMのみを用いるベースラインよりも精度と説明の質が高いことが示されており、単なるフラグ付けや削除にとどまらず説明責任と表現の自由に資することを目指しています。