インドネシアの製品レビューに対する感情分析で、ロジスティック回帰・SVM・LightGBMを注意機構付きBiLSTMとベンチマークする研究

arXiv cs.CL / 2026/4/29

📰 ニュースModels & Research

要点

  • この研究では、PyCaret AutoMLによる機械学習アプローチと、注意機構付きBiLSTMの深層学習モデルを比較し、インドネシアのEC製品レビューを二値の感情分類するベンチマークを行っています。
  • データセットは19,728件で正負が均等にバランスされており、機械学習モデルは10分割の層化交差検証、深層学習モデルはホールドアウトされたテストセットで評価されています。
  • 機械学習手法の中では、ロジスティック回帰が最良の性能を示し、97.26%の精度と97.26%のF1スコアを達成して、線形カーネルSVMやLightGBMよりも優れた結果でした。
  • 注意機構付きBiLSTMはほぼ同等の成績で、ホールドアウトされた3,946件のテストで97.24%の精度と97.24%のF1スコアを記録しています。
  • 著者らは、適切な前処理と特徴抽出を伴う従来型の機械学習が、複雑な系列型深層学習アーキテクチャに非常に近い性能を出し、場合によってはわずかに上回りつつ、計算コストは低くできると結論づけています。