MEME-Fusion@CHiPSAL 2026:ネパールのミームに対するヘイト検出とセンチメント分析のマルチモーダル・アブレーション研究
arXiv cs.CL / 2026/4/17
📰 ニュースTools & Practical UsageModels & Research
要点
- 本論文は、デーヴァナーガリー文字で書かれたネパールのミームに対して、ヘイトスピーチ検出とセンチメント分類を行うCHiPSAL 2026の共催タスク向けシステムを提案している。
- CLIP(画像)とBGE-M3(多言語テキスト)を4ヘッド自己注意と学習可能なゲーティング・ネットワークで接続し、サンプルごとにモダリティの寄与度を動的に重み付けするハイブリッドなクロスモーダル・アテンション融合を用いる。
- 8つのモデル構成での評価の結果、サブタスクA(2値ヘイト検出)ではテキストのみのベースラインに対して、クロスモーダル推論がF1-macroを5.9%向上させることを示した。
- 低リソースかつ文字体系依存の状況において、デーヴァナーガリーでは英語中心のビジョンモデルがほぼランダムに近い性能になること、また一般的なアンサンブル手法が相関する過学習によりデータ不足下で壊滅的に悪化し得ることの2点を明らかにしている。
- 提案手法のコードはGitHubで公開されており、再現性と今後の研究のために利用できる。



