ベンガル語(Bangla)分類タスクにおける外在的な性別バイアスの緩和
arXiv cs.CL / 2026/4/13
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、注目度が限られてきた低リソース言語の設定に焦点を当て、ベンガル語の事前学習済み言語モデルにおける外在的な性別バイアスを研究する。
- 感情、毒性、ヘイトスピーチ、皮肉(サーカズム)の分類のための、手作業で注釈付けされた4つのベンチマークデータセットを導入し、その後、最小ペア(ミニマルペア)によるバイアス評価のために、統制された性別の摂動でそれらを拡張する。
- 著者らは、対称KLダイバージェンスと交差エントロピー損失を組み合わせた、RandSymKLというランダム化による脱バイアス学習手法を提案し、複数のタスク固有モデルにまたがって、性別に起因する予測の変化を緩和する。
- 実験では、RandSymKLを既存の脱バイアス手法と比較し、分類精度を競争力のある水準に維持しつつバイアスを低減できることを報告する。
- 本研究では、実装と構築したデータセットを公開し、ベンガル語における性別バイアス緩和に関する追随研究を可能にする。
