要旨: 人間のアノテータは常に一致するわけではないこと、そしてこのような不一致は多くのアノテーション課題に固有のものであることが、ますます認識されてきています。しかし、ある課題におけるすべての事例が、同じ程度の意見の分岐を引き起こすわけではありません。本論文では、不適切な言語に対する段階的な人間の評価(攻撃的な言語、ヘイトスピーチ、毒性言語の認識を含む)におけるアノテーションのばらつきのパターンを調査します。さらに、アノテーションの不一致の程度が、テキストの特徴から予測できるかどうかを検討します。加えて、特定の項目に対するアノテータ間の視点の対立(オポジション)を定量化する指標である Opposition Index(対立指数)を提案し、潜在的に相反する人間の意見を伴う事例が予測可能かどうかを調査します。結果として、推定されたアノテーションの分散と観測された分散の間に、中程度の正の相関が見られました。分散予測においては、2つの手法が同等の性能を達成します。すなわち、分散値を直接予測する方法と、予測されたアノテーション分布から分散を推定する方法です。また、対立する視点の予測に関する結果では、対立指数の値が高い項目ほど予測が難しく、モデルによってしばしば過小評価されることが示されました。
段階評価における人手評価の不一致を定量化し、予測する
arXiv cs.CL / 2026/5/5
📰 ニュースModels & Research
要点
- 本論文は、攻撃的表現、ヘイトスピーチ、毒性表現の認識などの不適切言語に関する段階評価データで、項目ごとに人手の不一致がどの程度変動するかを分析します。
- 文の特徴量から注釈者の不一致度(ばらつき)を予測できるかを検証し、各項目で注釈者間の視点の対立を定量化する「Opposition Index」を提案します。
- 結果として、推定された不一致(分散)と観測された注釈分散の間に中程度の正の相関が確認され、テキストに基づく手がかりが人間の不一致を部分的に捉えられることを示します。
- 分散予測では、分散値を直接予測する方法と、注釈分布の予測から分散を推定する方法の2通りが、同程度の性能を達成します。
- 反対の視点を予測する場合、高いOpposition Indexを持つ項目は予測が難しく、モデルはその不一致を過小評価しがちであることが分かります。


