AI Navigate

SEAHateCheck: 東南アジアの低リソース言語におけるヘイトスピーチ検出の機能テスト

arXiv cs.CL / 2026/3/18

📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • SEAHateCheck は、低リソースの文脈に対応するため、4つの東南アジア言語(インドネシア語、タガログ語、タイ語、ベトナム語)におけるヘイトスピーチ検出の機能テスト用データセットを導入します。
  • SEAHateCheck は、大規模言語モデルを用いて文化的に適切なテストケースを生成し、現地の専門家による検証を得ることで、HateCheck および SGHateCheck のフレームワークを拡張します。
  • 本研究では、タガログ語のモデル精度が最も低く、スラングを用いたテストが特に難しいことが示され、暗黙的なヘイト表現とカウンタースピーチの検出におけるギャップが浮き彫りになります。
  • これらの言語にとって初の機能テストスイートとして、SEAHateCheck は研究と実務の両方のために、文化的に適合したヘイトスピーチのモデレーションツールを前進させるための堅牢なベンチマークを提供します。

要旨: ヘイトスピーチ検出は、言語資源に大きく依存しており、主に英語や中国語など資源が豊富な言語で利用可能であり、それによって東南アジアの低資源言語の研究者やプラットフォームが直面する障壁が生まれている。多様な社会言語的背景がオンライン上のヘイト規制を複雑にする。これに対処するため、SEAHateCheck を導入する。インドネシア、タイ、フィリピン、ベトナムに合わせた先駆的なデータセットで、インドネシア語、タガログ語、タイ語、ベトナム語を網羅する。 HateCheck の機能テストフレームワークを基に、 SGHateCheck の手法を洗練させた SEAHateCheck は、文化的に関連性のあるテストケースを提供し、大規模言語モデルによって補強され、現地の専門家によって正確性が検証される。 最新技術と多言語モデルを用いた実験は、特定の低資源言語におけるヘイトスピーチ検出における限界を露わにした。 特に、タガログ語のテストケースはモデルの精度が最も低く、言語的複雑さと訓練データの不足が原因と考えられる。 対照的に、スラングベースの機能テストは最も難しく、文化的にニュアンスのある表現に対してモデルが苦戦することが分かった。 SEAHateCheck の診断的洞察は、暗黙のヘイト検出におけるモデルの弱点と、カウンター・スピーチ表現の取り扱いにおけるモデルの苦戦をさらに浮き彫りにした。 これらの東南アジア諸言語の最初の機能テストスイートとして、本研究は研究者に堅牢なベンチマークを提供し、包摂的なオンラインコンテンツ規制の実用的で文化的に調和したヘイトスピーチ検出ツールの開発を推進する。

返却形式: {"translated": "翻訳されたHTML"}