紛争中のソーシャルメディア分極化：イスラエル・パレスチナのRedditコメントに関するイデオロギー的スタンス・データセットからの洞察

arXiv cs.CL / 2026/4/16

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、2023年10月から2024年8月に収集されたイスラエル・パレスチナ関連のRedditコメント9,969件を分析することで、紛争状況におけるイデオロギー的分極化を研究する。
課題を3つのカテゴリ（親イスラエル、親パレスチナ、中立）へのスタンス分類として位置づけ、機械学習、ニューラルネットワーク、事前学習済み言語モデル、オープンソースLLM向けのプロンプト・エンジニアリングなど、複数のアプローチを評価する。
評価は正解率（accuracy）、適合率（precision）、再現率（recall）、F1スコアで測定し、異なるモデル系統およびプロンプト戦略を直接比較できるようにしている。
最良の結果は、Mixtral 8x7Bに適用したプロンプト戦略（「Scoring and Reflective Re-read」）で得られ、報告されたすべての指標において他の検証済み手法を上回る。
データセットは公開されており、高度に分極化した文脈におけるスタンス検出手法のさらなる分析および外部検証を支援する。

要旨: 戦争のような政治的にセンシティブな状況では、ソーシャルメディアは分極化した言説や強いイデオロギー的立場の表明のための場として機能する。先行研究では一般的な文脈におけるイデオロギー的立場の検出が検討されてきた一方で、紛争に特化した設定には十分な注意が払われていない。本研究はこのギャップを埋めるために、2023年10月から2024年8月の間に収集されたイスラエル・パレスチナ紛争に関する9,969件のRedditコメントを分析した。コメントは3つの立場クラス、すなわち「親イスラエル」「親パレスチナ」「中立」に分類した。機械学習、事前学習済み言語モデル、ニューラルネットワーク、そしてオープンソースの大規模言語モデル（LLM）向けのプロンプトエンジニアリング手法など、さまざまなアプローチを用いてこれらの立場を分類した。性能は、精度（accuracy）、適合率（precision）、再現率（recall）、F1スコアなどの指標で評価した。検証した手法の中では、Mixtral 8x7Bにおける「Scoring and Reflective Re-read」プロンプトが、すべての指標において最も高い性能を示した。本研究は、強く分極化したソーシャルメディア文脈におけるイデオロギー的立場の検出に対して、異なるモデルの有効性を比較する洞察を提供する。本研究で用いたデータセットは、さらなる探索と検証のために公開されている。