構成要素の総和を超えて:マルチモーダルなヘイトスピーチ検出における意図のシフトを解読する
arXiv cs.CL / 2026/3/24
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、テキストと画像の相互作用によって有害な意図が単一のモダリティだけではなく現れる可能性がある、マルチモーダルなソーシャルメディアのヘイトスピーチ検出の難しさに取り組む。
- 単純な二値分類を、意味的な意図のシフトに焦点を当てたきめ細かな枠組みに置き換え、善意に見える手がかり同士が組み合わさって暗黙のヘイトを形成する場合や、言語と視覚が毒性を反転または中和する場合などを扱う。
- 著者らは、露骨なスラングではなくモダリティ間の相互作用に基づいて真の意図が決まるよう設計された H-VLI(Hate via Vision-Language Interplay)ベンチマークを導入する。
- これに対処するため、彼らは「エージェントによる討論(agent debate)」の枠組みである ARCADE を提案し、裁判を模した議論をシミュレートすることで、判決を下す前により深い意味的手がかりをモデルに精査させる。
- 実験の結果、ARCADE は H-VLI ベンチマークの難しい暗黙ケースにおいて大幅に性能を改善しつつ、既存のヘイトスピーチベンチマークにおいても競争力を維持していることが示され、コード/データは公開されている。
