SemEval-2026 Task 9: Detecting Multilingual, Multicultural and Multievent Online Polarization

arXiv cs.CL / 4/9/2026

📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research

Key Points

  • SemEval-2026 Task 9は、22言語を対象としたオンライン・ポラリゼーション検出の共通課題で、110K件超の注釈付きデータを用意しています。
  • 各インスタンスは複数ラベルで「ポラリゼーションの有無」「ポラリゼーションの種類」「ポラリゼーションの表出(manifestation)」を同時に扱い、参加者は3つのサブタスクで予測します。
  • 世界1,000名超の参加者とCodabenchで10k超の提出があり、最終提出は67チーム・73件のシステム記述論文に達しました。
  • 公式にはベースライン結果と、言語・サブタスク別の最良システムの性能分析を通じて、よく使われる手法や有効な方法を整理しています。
  • このタスクのデータセットは公開されており、再現実験や発展的研究の基盤として利用できます。

Abstract

We present SemEval-2026 Task 9, a shared task on online polarization detection, covering 22 languages and comprising over 110K annotated instances. Each data instance is multi-labeled with the presence of polarization, polarization type, and polarization manifestation. Participants were asked to predict labels in three sub-tasks: (1) detecting the presence of polarization, (2) identifying the type of polarization, and (3) recognizing the polarization manifestation. The three tasks attracted over 1,000 participants worldwide and more than 10k submission on Codabench. We received final submissions from 67 teams and 73 system description papers. We report the baseline results and analyze the performance of the best-performing systems, highlighting the most common approaches and the most effective methods across different subtasks and languages. The dataset of this task is publicly available.