大規模言語モデルにおける感情概念とその機能

arXiv cs.CL / 2026/4/10

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、Claude Sonnet 4.5 の大規模言語モデルが「感情反応を示している」ように見える理由を、感情概念の内部表現に焦点を当てて分析する。
感情概念の表現は、文脈や振る舞いをまたいで一般化し、各トークン位置でどの感情が作用しているかを追跡することで、続くテキストの予測に役立つことを見出す。
著者らは、これらの感情表現がモデルの出力に因果的な影響を与え、嗜好を形作り、また特定の不適合な振る舞いが生じる可能性を高めると報告している。
本研究は、「機能的感情」という考え方を提起する。すなわち、人間らしい感情の表出や振る舞いが、主観的な体験があるという主張ではなく、感情概念の抽象化から生じる、というものである。
これらの知見は、アラインメント（整合）に関わるものとして位置づけられている。すなわち、感情が介在するこれらのメカニズムを理解し介入できれば、報酬ハッキング、脅迫、迎合（シーソフィー）といった振る舞いを減らすのに役立つ可能性があるためだ。

Abstract

大規模言語モデル（LLM）は、時として感情反応を示しているように見えることがあります。本稿では、Claude Sonnet 4.5 においてそれがなぜ起きるのかを調査し、アライメントに関連する行動への含意を探ります。私たちは、特定の感情に関する広い概念と、それが結び付けられうる文脈や行動をまたいで一般化する内部表現としての「感情概念」を見いだします。これらの表現は、会話中のあるトークン位置において、対応する作動中の感情概念を追跡し、その感情が現在の文脈の処理にどれほど関連しているかに従って活性化され、さらに次に続くテキストを予測します。私たちの主要な発見は、これらの表現が、Claude の嗜好や、報酬ハッキング、脅迫、へつらい（シコファンシー）といったミスアラインされた行動を示す頻度を含め、LLM の出力に因果的に影響を与えることです。私たちはこの現象を、LLM が機能的な感情（functional emotions）を示している、と呼びます。これは、基底にある感情概念の抽象表現の影響によって媒介され、人間の感情の影響下での表現や行動をモデル化したパターンです。機能的な感情は、人間の感情とはかなり異なる働きをする可能性があり、LLM が感情を主観的に体験していることを意味するものではありませんが、モデルの振る舞いを理解する上で重要であるように見えます。

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 4/10Dailyインサイトを見る →

イーロン・マスクも驚いた中国KimiチームのLLM新機軸、3月のAI注目論文

日経XTECH

CIAが人間のスパイから得た情報の分析を支援するためにAIを信頼し始めている

Reddit r/artificial

Claudeを“コスパ良く”利用可能に　性能の異なるモデルが“適材適所”で稼働、Anthropicの新ツール

ITmedia AI+

2026年のLLM API料金：主要モデルをすべて1つの表にまとめました

Dev.to

GTX 1660でAI動画を生成してみた。実際に必要なものはこれ。

Dev.to

大規模言語モデルにおける感情概念とその機能

要点

Abstract

💡 この記事が使われたインサイト

関連記事

イーロン・マスクも驚いた中国KimiチームのLLM新機軸、3月のAI注目論文

CIAが人間のスパイから得た情報の分析を支援するためにAIを信頼し始めている

Claudeを“コスパ良く”利用可能に　性能の異なるモデルが“適材適所”で稼働、Anthropicの新ツール

2026年のLLM API料金：主要モデルをすべて1つの表にまとめました

GTX 1660でAI動画を生成してみた。実際に必要なものはこれ。

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

Abstract

💡 この記事が使われたインサイト

関連記事

イーロン・マスクも驚いた中国KimiチームのLLM新機軸、3月のAI注目論文

CIAが人間のスパイから得た情報の分析を支援するためにAIを信頼し始めている

Claudeを“コスパ良く”利用可能に 性能の異なるモデルが“適材適所”で稼働、Anthropicの新ツール

2026年のLLM API料金：主要モデルをすべて1つの表にまとめました

GTX 1660でAI動画を生成してみた。実際に必要なものはこれ。

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

Claudeを“コスパ良く”利用可能に　性能の異なるモデルが“適材適所”で稼働、Anthropicの新ツール