TCDA:スレッド制約付き談話認識型モデリングによる会話センチメント四つ組分析

arXiv cs.CL / 2026/5/5

📰 ニュースModels & Research

要点

  • この論文は、複数ラウンドの対話にまたがる複雑な関係を捉える必要がある「会話に基づく側面別センチメント四つ組分析(DiaASQ)」を対象とする。
  • 従来手法は、構造ノイズを生む(GCNベース)か、会話の構造と時間的要素を十分に表現できない(標準RoPE、さらに「Distance Dilution」問題)という限界があると指摘する。
  • 提案手法は、スレッド制約に基づいてスレッド間のノイズを抑えつつ、ルートアンカリングでグローバルなつながりを維持するThread-Constrained Directed Acyclic Graph(TC-DAG)と、談話を考慮したRoPE(D-RoPE)を組み合わせる。
  • D-RoPEはデュアルストリームの射影とマルチスケール周波数信号を用い、ツリーのような距離でスレッド依存を表現し、トークンレベルの語順と発話レベルの時間進行をより明確に分離する。
  • 2つのベンチマークで実験を行い、本手法が最先端(state-of-the-art)の性能を達成したと報告している。

要旨: 対話型アスペクトベース感情クアドラプル分析(DiaASQ)は、複数ラウンドの対話における複雑な相互関係を捉える必要があります。既存手法は通常、単純なグラフ畳み込みネットワーク(GCN)を用いますが、これは構造上のノイズを導入し、対話の時間的な順序を考慮できません。または、標準的なRoPEを用いますが、これは平坦な系列における相対距離を暗黙的に捉える一方で、トークンレベルの構文順序と発話レベルの進行を明確に分離できず、Distance Dilution(距離希釈)問題に悩まされる可能性があります。これらの課題に対処するために、Thread-Constrained Directed Acyclic Graph(TC-DAG)とDiscourse-Aware Rotary Position Embedding(D-RoPE)を組み合わせた新しい枠組みを提案します。具体的には、TC-DAGはスレッド制約に基づいてスレッド間のノイズを除去し、ルートアンカリングによってグローバルな接続性を維持し、対話の時間的系列を取り込みます。D-RoPEは、デュアルストリームの射影とマルチスケールの周波数信号により多層意味を整合させ、木構造のような距離を用いてスレッド依存関係を捉え、発話レベルの進行を組み込むことでトークンレベルのDistance Dilution問題を緩和します。2つのベンチマークデータセットでの実験結果は、提案した枠組みが最先端の性能を達成することを示しています。