ガザ戦争の見出しにおける感情分類:大規模言語モデルとアラビア語で微調整したBERTモデルの比較分析
arXiv cs.CL / 2026/4/13
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、2023年のガザ戦争を事例として、対立に関連するアラビア語ニュース見出しに対して異なるAIアーキテクチャが感情をどのように解釈するかを分析する。
- 10,990件の見出しからなるコーパスを用い、単一の精度ベンチマークではなく情報理論的および分布的な指標により、3つの大規模言語モデルと6つの微調整済みアラビア語BERTバリアントを比較する。
- 微調整されたBERTモデル(特にMARBERT)は、感情を中立と分類する強い傾向を示す一方で、LLMは一貫して否定的な感情を増幅する。
- 本研究では、LLaMA-3.1-8Bが評価設定においてほぼ完全に否定方向へ崩壊することが分かる。
- フレーム条件付きテストにより、GPT-4.1は(人道/法的/治安といった)物語フレームに基づいて感情判断を調整できるが、他のLLMは文脈による調整が限定的であることが示される。これは、モデルの選択が「解釈のレンズ」として機能することを示唆している。




