感情検出を強化するための言語的シグネチャ

arXiv cs.CL / 2026/3/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、解釈可能な言語的規則性（感情固有の「言語的シグネチャ」）が、複数のテキストデータセットとラベル体系にまたがって感情を確実に示し得るかどうかを検討する。
研究者らは13の英語感情データセットから言語的特徴のシグネチャを抽出し、これらの高レベル特徴をトランスフォーマーモデルに追加することで感情分類が改善するかを検証する。
言語的シグネチャで拡張したRoBERTaベースのモデルは一貫した改善を示し、GoEmotionsベンチマークで最大+2.4のmacro F1を達成する。
結果は、明示的な語彙の手がかりがトランスフォーマー表現を補完し、感情カテゴリ予測の頑健性を高め得ることを示唆している。

arXiv:2603.20222v1 Announce Type: new

Abstract

感情検出はNLPにおける中核的な課題であり、近年は確立されたデータセットで学習したトランスフォーマーベースのモデルによって進展がもたらされてきました。しかし、異なるコーパスやラベル間で感情がどのように表現されるかを特徴づける言語的な規則性については、ほとんど分かっていません。本研究では、言語的特徴がテキストにおける感情認識のための信頼できる、解釈可能なシグナルとして機能し得るかを検討します。そこで、13の英語データセットから感情固有の言語シグネチャを抽出し、これらの特徴をトランスフォーマーモデルに組み込むことが性能に与える影響を評価します。高レベルの言語特徴で強化したRoBERTaベースのモデルは、GoEmotionsベンチマークで最大+2.4のマクロF1に相当する一貫した性能向上を達成し、明示的な語彙的手がかりがニューラル表現を補完し、感情カテゴリの予測における頑健性を高められることを示しています。