セマンティクスを超えて：小規模言語モデルによる機械翻訳で細かな感情を保持する度合いの測定

arXiv cs.CL / 2026/5/1

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、小規模言語モデル（EuroLLM、Aya Expanse、Gemma）が、機械翻訳において感情の細かなニュアンスをどれだけ保持できるかを検証し、意味の同等性だけでなく情動の忠実性に焦点を当てています。
GoEmotionsデータセット（Redditコメントを28の感情カテゴリでラベル付け）とバックトランスレーション手法を用いて、5つの欧州言語（ドイツ語、フランス語、スペイン語、イタリア語、ポーランド語）にわたる感情保持を評価します。
モデル固有の感情保持能力がどの程度か、さらに感情を意識したプロンプトが感情の忠実性を高められるかを調べます。
MT評価を支える感情分類器として、BERTの代替としてModernBERTの性能も評価します。
総じて、本研究は意味の同等性だけではなく「感情の保持」に特化した評価フレームワークと比較結果を提示しています。

Abstract

感情的なニュアンスを保持することは、機械翻訳（MT）において依然として課題です。そこではしばしば意味の同等性が、感情の忠実性よりも優先されます。本論文では、3つの最先端の小型言語モデル（SLM）――EuroLLM、Aya Expanse、Gemma――の性能を、逆翻訳における細かな感情の維持という観点で評価します。28の異なるカテゴリにわたるRedditのコメントから構成されるGoEmotionsデータセットを用い、5つのヨーロッパ言語、すなわちドイツ語、フランス語、スペイン語、イタリア語、ポーランド語にわたる感情の保持を評価します。具体的には、(i) これらのSLMが感情的なセンチメントを保持するうえで備えている本来的な能力、(ii) 感情を意識したプロンプトが保持の改善にどれほど有効か、(iii) MT評価における感情分類のための、BERTに代わる現代的な手法としてのModernBERTの性能――を調査します。

AIの次に来る技術、投資データで浮き彫りにランキング上位を徹底解説

日経XTECH

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

Dev.to

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣

ITmedia AI+

なぜエンタープライズのAIパイロットは失敗するのか

Dev.to

誰も欲しがらないのに、私は毎日使っているPDF機能

Dev.to

セマンティクスを超えて：小規模言語モデルによる機械翻訳で細かな感情を保持する度合いの測定

要点

Abstract

関連記事

AIの次に来る技術、投資データで浮き彫りにランキング上位を徹底解説

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣

なぜエンタープライズのAIパイロットは失敗するのか

誰も欲しがらないのに、私は毎日使っているPDF機能

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

関連記事

AIの次に来る技術、投資データで浮き彫りに ランキング上位を徹底解説

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

ChatGPTの「画像生成」、どう進化？ 開発者に聞く “文字化け解消”の秘訣

なぜエンタープライズのAIパイロットは失敗するのか

誰も欲しがらないのに、私は毎日使っているPDF機能

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

AIの次に来る技術、投資データで浮き彫りにランキング上位を徹底解説

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣