IndoBERT-Sentiment:インドネシア語テキストのための文脈条件付き感情分類

arXiv cs.CL / 2026/4/9

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、トピックの文脈とインドネシア語テキストの両方を用いる文脈条件付きモデル「IndoBERT-Sentiment」を提案し、文脈非依存のアプローチよりも感情分類を改善することを示している。
  • IndoBERT-Sentimentは、パラメータ335MのIndoBERT Largeをベースに構築され、188のトピックにまたがる31,360件のラベル付き文脈-テキスト対で学習されている。
  • 本モデルは評価でF1マクロ0.856、精度88.1%という強い性能を達成している。
  • 同一のテストセットでの比較では、広く使われている3つの汎用的なインドネシア語感情ベースラインをF1で35.6ポイント上回っている。
  • 著者らは、(関連性で以前に用いられていた)文脈条件付けを転用することで感情分類が効果的に向上し、分離型モデルが犯す系統的な誤りの修正にもつながると主張している。