ガザ戦争の見出しにおける感情分類：大規模言語モデルとアラビア語で微調整したBERTモデルの比較分析

arXiv cs.CL / 2026/4/13

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、2023年のガザ戦争を事例として、対立に関連するアラビア語ニュース見出しに対して異なるAIアーキテクチャが感情をどのように解釈するかを分析する。
10,990件の見出しからなるコーパスを用い、単一の精度ベンチマークではなく情報理論的および分布的な指標により、3つの大規模言語モデルと6つの微調整済みアラビア語BERTバリアントを比較する。
微調整されたBERTモデル（特にMARBERT）は、感情を中立と分類する強い傾向を示す一方で、LLMは一貫して否定的な感情を増幅する。
本研究では、LLaMA-3.1-8Bが評価設定においてほぼ完全に否定方向へ崩壊することが分かる。
フレーム条件付きテストにより、GPT-4.1は（人道／法的／治安といった）物語フレームに基づいて感情判断を調整できるが、他のLLMは文脈による調整が限定的であることが示される。これは、モデルの選択が「解釈のレンズ」として機能することを示唆している。

note

note

note

note

note