DimABSA:次元(次元的)なアスペクトベース感情分析のための多言語・多領域データセット構築

arXiv cs.CL / 2026/4/27

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 本論文では、肯定・否定といった粗いラベルの代わりに連続値のヴァレンス(Valence)・覚醒度(Arousal:VA)スコアを用いる、次元(ディメンショナル)アプローチを提案しています。
  • DimABSAとして、アスペクトの語(aspect terms)・カテゴリ(aspect categories)・意見語(opinion terms)といった従来のABSA要素に加え、VAスコアも注釈した多言語・多領域のデータセットを新たに導入します。
  • 3つのサブタスクを定義し、VAと異なるABSA要素の組み合わせによって、従来のカテゴリ型ABSAから次元型ABSAへの橋渡しを行います。
  • カテゴリ出力と連続出力が混在するタスクの評価のため、VA予測誤差を標準F1に組み込む新しい統一指標「continuous F1(cF1)」を提案しています。
  • 促進(プロンプト)と微調整の両方を行った大規模言語モデルでベンチマークを提示しており、さらにデータセットは公開されSemEval-2026 Task 3のTrack Aで利用され、300人超の参加者を集めました。

Abstract

批判対象(アスペクト)ベースの感情分析(ABSA)は、微細なアスペクト単位で感情を抽出することに焦点を当てており、実世界のさまざまな領域に広く適用されてきました。しかし、既存のABSA研究は粗い粒度のカテゴリラベル(例:ポジティブ、ネガティブ)に依存しているため、微妙な情動状態を捉える能力が制限されています。この制約に対処するため、我々は感情を連続値の快-覚醒(valence-arousal: VA)スコアで表す次元(ディメンジョン)アプローチを採用し、アスペクトレベルと感情レベルの双方において微細な分析を可能にします。そこで本研究では、従来のABSA要素(アスペクト項、アスペクトカテゴリ、意見項)に加え、新たに導入したVAスコアの注釈も付与された、初の多言語・次元型ABSAリソースであるDimABSAを提案します。本リソースには、6言語・4領域にまたがる42,590文の中から合計76,958件のアスペクトインスタンスが含まれています。さらに、VAスコアと異なるABSA要素を組み合わせる3つのサブタスクを導入し、従来のABSAから次元型ABSAへの橋渡しを行います。これらのサブタスクはカテゴリ出力と連続出力の双方を含むため、標準的なF1にVA予測誤差を組み込む新しい統一指標、連続F1(cF1)を提案します。すべてのサブタスクに対して、プロンプト付きおよび微調整済みの大規模言語モデルの両方を用いた包括的なベンチマークを提供します。結果は、DimABSAが挑戦的なベンチマークであり、多言語次元型ABSAの発展の基盤となることを示しています。なお、DimABSAデータセットは公開されており、SemEval-2026 Task 3のTrack Aで使用され、300人を超える参加者を集めました。