arXiv:2603.20222v1 Announce Type: new
Abstract
感情検出はNLPにおける中核的な課題であり、近年は確立されたデータセットで学習したトランスフォーマーベースのモデルによって進展がもたらされてきました。しかし、異なるコーパスやラベル間で感情がどのように表現されるかを特徴づける言語的な規則性については、ほとんど分かっていません。本研究では、言語的特徴がテキストにおける感情認識のための信頼できる、解釈可能なシグナルとして機能し得るかを検討します。そこで、13の英語データセットから感情固有の言語シグネチャを抽出し、これらの特徴をトランスフォーマーモデルに組み込むことが性能に与える影響を評価します。高レベルの言語特徴で強化したRoBERTaベースのモデルは、GoEmotionsベンチマークで最大+2.4のマクロF1に相当する一貫した性能向上を達成し、明示的な語彙的手がかりがニューラル表現を補完し、感情カテゴリの予測における頑健性を高められることを示しています。




