セマンティクスを超えて:小規模言語モデルによる機械翻訳で細かな感情を保持する度合いの測定
arXiv cs.CL / 2026/5/1
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、小規模言語モデル(EuroLLM、Aya Expanse、Gemma)が、機械翻訳において感情の細かなニュアンスをどれだけ保持できるかを検証し、意味の同等性だけでなく情動の忠実性に焦点を当てています。
- GoEmotionsデータセット(Redditコメントを28の感情カテゴリでラベル付け)とバックトランスレーション手法を用いて、5つの欧州言語(ドイツ語、フランス語、スペイン語、イタリア語、ポーランド語)にわたる感情保持を評価します。
- モデル固有の感情保持能力がどの程度か、さらに感情を意識したプロンプトが感情の忠実性を高められるかを調べます。
- MT評価を支える感情分類器として、BERTの代替としてModernBERTの性能も評価します。
- 総じて、本研究は意味の同等性だけではなく「感情の保持」に特化した評価フレームワークと比較結果を提示しています。




