Anthropicの感情論文をQwen3-4Bで再現した

Zenn / 2026/4/26

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • Anthropicが提案した「感情」関連の論文内容を、Qwen3-4Bで再現する試みについて述べている。
  • 小規模モデル(Qwen3-4B)でも同種の挙動を得られるかを検証することが主眼になっている。
  • 再現のための検証プロセスや得られた示唆が、モデル選定・再現可能性の観点で共有されている。
  • 研究アイデアの実装・検証を、手元のモデルで追試する流れを促す内容になっている。
はじめに Anthropicが2026年4月に発表した論文「Emotion Concepts and their Function in a Large Language Model」は、Claude Sonnet 4.5の内部に感情に相当するベクトル表現が存在し、それが行動に因果的に影響することを示した研究です。手法の詳細は前回の記事で解説しました。 今回は「実際に手を動かして再現できるのか」という問いに答えます。使用したモデルはQwen3-4B Dense(ローカル実行)、実装はnnsightとGradioです。再現コードはGitHubで公開しています。 👉 50s-zeroto...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →