生成AIの「内部」に介入して、性格特性を付与してみると…

note / 4/21/2026

💬 OpinionIdeas & Deep AnalysisModels & Research

Read original →

共有:

Key Points

生成AIの「内部（内部挙動）」に介入し、応答の振る舞いに性格特性を付与する試みが扱われている。
性格のような高次の属性を、モデルの外側のプロンプトだけでなく内部側に働きかける発想で実現しようとしている点が中心論点である。
性格特性の付与により、同じ入力でも一貫した態度・言い回し・優先度などが変わる可能性が示唆される。
その結果として、対話設計やエージェント運用における制御可能性（キャラクター性/一貫性/期待値調整）を高められることが主な狙いだと考えられる。

生成AIの「内部」に介入して、性格特性を付与してみると…

濱口貴光@AIとデータサイエンスが好きな薬剤師

2026年4月21日 06:30

A Systematic Analysis of the Impact of Persona Steering on LLM Capabilities Imbuing Large Language Models (LLMs) with specific personas i arxiv.org

今回の研究は、「Big Five（外向性、協調性、誠実性、神経症傾向、開放性）」の5つの性格特性に注目し、「Neuron-based Personality Trait Induction（NPTI）」 という手法でLLMの内部表現を直接操作して、それぞれの性格を誘導することを試みたものです。

つまり、プロンプトを用いて「あなたは外向的な人です」のように設定するのではなく、モデル内部の特定の部分を調整して、その性格を表現させるような操作をしています。

著者らは、今回の実験から次の4点を明らかにしようとしています。

再現性
ある性格設定を入れたときに性能が上がる or 下がるという変化は、モデルの種類が変わっても同じように出現するのか
領域特異性
性格の影響は、どのような認知課題でも同じように効果が出るのか、それとも課題の種類ごとに異なるのか
特性ごとの差
Big Fiveの5つの性格特性のうち、どの特性が特に強く性能に影響するのか、またその影響の方向はどうなっているのか
人間との整合性
LLMで見られる「性格と認知能力の関係」が、人間の心理学で知られている「性格と認知の関係」と方向性が似ているのか
（たとえば、人間では「開放性が高い人はクリエイティブな問題解決が得意」とされているが、LLMでも同じような傾向が出るか）

【補足：Big Fiveとは】
「Big Five」とは、心理学における人の性格を究極的に突き詰めると5つの次元に統合されるという理論です [1] [2] 。

研究の方法

1. 使用されたモデル

著者らは、モデルの種類が違っても同じ傾向が出現するかを比較するために、7B〜9Bクラスの「LLaMA-3-8B-Instruct」「Mistral-7B-v0.3」「Gemma-2-9B-Instruct」「Qwen2.5-7B-Instruct」を用いて検証しました。

また、モデルのサイズ（パラメータ数）が変化するとどのように影響が及ぶのかを検証するために、Qwen2.5のパラメータ数を変えた「Qwen2.5-0.5B-Instruct」「Qwen2.5-1.5B-Instruct」「Qwen2.5-3B-Instruct」「Qwen2.5-14B-Instruct」でも検証されています。

2. 評価タスク

性格がどのような認知能力に影響するのかを細かく見るために、6種類のベンチマークを、4つの認知領域にまたがって評価しています。

IFEval：指示の理解と実行（どれだけ正確に指示に従えるか）
MMLU-Pro、GPQA：知識の検索と専門知識の評価（どれだけ知識をうまく引き出せるか）
BBH、MuSR：多段階にわたる推論と問題解決（複雑な思考が必要なタスクを遂行できるか）
GSM8K：計算・論理的な数学の課題を遂行できるか

3. 性格の付与（NPTI）

先述の通り、今回の研究では、性格をプロンプトの文言で指定するのではなく、NPTIという手法でモデルの内部表現を直接操作して付与しています。

NPTIでは、「PersonalityBench」というデータセットを使い、まずはBig Fiveの各性格特性に関連するFFN（受け取った情報を整理して、重要な特徴をはっきりさせる部分）のニューロンを特定します。
そして、そのニューロンの活性を強めたり弱めたりすることで、特定の性格特性が「高めの性格」と「低めの性格」を誘導します。

結果

**Table 1：ベースライン性能**
Chen, J et al. (2026). A systematic analysis of the impact of persona steering on LLM capabilities.

以降の実験結果は、このベースラインと比較してどれだけ変化しているかを確認・評価します。

1. モデルの種類が変わると

**Figure 2：7B–9B級モデル群の平均変化量（ΔAcca）と、方向の一致率（SA）**
Chen, J et al. (2026). A systematic analysis of the impact of persona steering on LLM capabilities.

結果を見てみると、以下のようなことが読み取れます。

IFEval（指示の理解と実行）
ほぼすべての性格特性で性能が上がり、増分は+10.9%〜+15.1%でした。方向の一致率は約0.98と、非常に高い一貫性がみられた。
BBH（多段階にわたる推論）
すべての性格特性で性能が悪化し、特に低外向性（EL）では−39.5%と大きく悪化していた。
方向の一致率は1.00となっており、こちらも非常に高い一貫性がみられた。
GPQAとMuSR（専門知識の評価・複雑な問題解決）
ここでは方向の一致率が約0.75となっており、IFEvalやBBHと比較すると一貫性に欠ける傾向があった。

著者らは、指示の理解と実行、多段階にわたる推論のような「過程に依存する能力」は、性格特性の影響がモデル間で比較的再現されやすい一方で、専門知識や知識の表現に強く依存するような課題では、モデルごとの違いが出やすいと述べています。

2. モデルのサイズおよびタスクの種類ごとにみた、性格特性の影響の大きさ（感受性）

**Figure 3：モデルサイズごとの感受性（a）とタスクごとの感受性（b）**
Chen, J et al. (2026). A systematic analysis of the impact of persona steering on LLM capabilities.

IFEval（指示の理解と実行）
感受性は24.8%〜78.1%とばらついているが、他のタスクと比較して感受性が高い傾向があり、モデルのサイズが変わってもその影響が残った。
BBH・GSM8K（多段階にわたる推論・数学の課題）
モデルサイズ7Bあたりで感受性が高くなるが、その後は低下する傾向があった。特にBBHでは、サイズが大きいモデルほど影響が小さくなる傾向があった。

著者らは、「指示の理解と実行を行うタスクは性格特性の影響を強く受ける」「多段階にわたる推論や数学の課題では、性格特性を含めるとかえって悪化することが多い」と述べており、加えて「モデルサイズが大きくなるほど推論が安定し、性格特性による影響を受けにくくなる」という可能性を示唆しています。

3. Big Fiveの各特性ごとの影響

**Table 2：Big Five各特性の影響量（Impact）と方向の安定性（Uniformity）**
Chen, J et al. (2026). A systematic analysis of the impact of persona steering on LLM capabilities.

この結果から、「開放性（O）と外向性（E）は安定して性能に影響する」「神経症傾向（N）は逆に低く設定する方が有利（課題を解くうえで、成績が良くなりやすかった）」という傾向があることが読み取れます。

論文では、この結果は心理学における「新しいことに前向きな人は発想が広がりやすい [3] [4] 」「不安が高いと注意のコントロールが乱れやすくなり、認知効率が落ちる [5] 」という考え方とも整合している可能性があると主張されています。

4. 人間の性格研究と、どのくらい似ていたのか

著者らは、人間の心理学で知られている「性格と認知の関係」と、LLMに性格特性を付与したときの結果を比較しています。

その結果、全体の一致率は73.68％（19組の比較のうち14組で、人間の心理学の予測とLLMの結果の方向が一致）で、開放性・誠実性に関しては87.50％、神経症傾向は57.10％という結果になりました。
特に開放性に関しては、8つのベンチマークのうち7つで、開放性が高い条件のほうが好成績を収めました。

著者らはこの結果を受けて、先程の内容とも一部重複しますが、以下のような人間の心理学の先行研究の方向性と似たような傾向があると指摘しています。

開放性は、新しいことやアイデアに興味を持ちやすく、頭を柔らかく使って考えたり、いろいろな可能性を探る力と関係しやすい [3] [4] 。
誠実性は、あきらめずに目標に向かい続けたり、集中力を保って物事に取り組む力と関係しやすい [6] 。
神経症傾向に関して、不安や心配が強くなりすぎると、頭の働きの効率が低下し、パフォーマンスが落ちやすくなる [5] 。

ただし、この結果は単に符号が一致しているという話であって、「LLMにも人間と同じ性格構造が宿っている」ことを示しているわけではないことに注意が必要です。

5. Dynamic Persona Routing（DPR）

**Table 3：DPRの結果**
Chen, J et al. (2026). A systematic analysis of the impact of persona steering on LLM capabilities.

著者らは、今回の結果を応用した「Dynamic Persona Routing（DPR）」という考え方を提案しています。これは、「似た質問で過去にうまくいった性格特性を、今の質問にも適用する」 というものです。

その結果、以下のようなことが示唆されました。

専門知識依存の課題や柔軟性が必要な課題では、DPRがある程度有効と考えられる
数理推論や厳格な論理的推論では、性格特性を変更しないほうがよい場合がある

ただし、DPRはLLaMA-3-8B-Instructをもとに作った過去のデータを使って動いているため、他のモデルや条件において同様の結果が得られるとは限りません。

注意点

今回の評価はベンチマーク中心の評価であり、長文生成、対話の継続、文書の要約といった実用的なタスクにそのまま適用できるとは限りません。
性格特性による性能差が生じた理由が、考え方の方向性が変わったからなのか、どこに注目するかが変わったからなのか、もしくはLLMの中の情報のまとまり方が変わったからなのか、などといった違いは明らかになっていません。

性格を付与しても、出力の品質が上がるとは限らない

こちらの記事でも述べましたが、生成AIへの性格（や役割）の付与は、必ずしも出力の質の向上につながるとは限りません。
実際、指定された「キャラクター」を維持しようとするほどタスク性能が犠牲になったり、対話が長くなるほど危険な質問を拒否しなくなったり、逆に安全な質問まで拒否するようになったりすることが示唆されています [7] 。

さらに、LLM内部のFFN（受け取った情報を整理して、重要な特徴をはっきりさせる部分）のニューロンに介入した今回の実験でも、与えられた認知課題の種類によっては、性格特性の付与が逆にパフォーマンスを悪化させてしまう可能性が示唆されました。

ゆえに、プロンプトで指示をするにしても、LLMの内部構造に介入するにしても、LLMへの性格特性の付与は用法・用量を守る必要があるということです。
特に、正確さが保証されるべき用途で活用する場合は、キャラ付けや性格の付与が余計な情報になってしまわないよう、注意しましょう。

仮に薬剤師の業務で今回の示唆を応用できるとしたら

今回のアプローチは我々が気軽にマネできるものではないので、あくまで私の想像程度の情報になりますが、今回の示唆を薬剤師の業務に応用するのであれば、以下のような業務に適していると考えられます。

患者さん向けの説明文の調整
主に「指示の理解と実行」、および部分的に「知識の検索」と「専門知識の評価」が必要になるタスクです。ゆえに、「高い協調性、中〜高レベルの誠実性、低い神経症傾向」の性格特性の付与が有効と考えられます。
医療従事者向けの文章の作成
こちらも主に「指示の理解と実行」、および「知識の検索」と「専門知識の評価」が必要になるタスクですが、患者さん向けの説明文よりは簡潔さ・要点整理・フォーマット遵守を重視すべきことが多いため、「中〜高レベルの協調性、高い誠実性、低い神経症傾向」の性格特性の付与が有効と考えられます。
指示（文字制限など）に沿った要約や書き直し
「指示の理解と実行」が必要不可欠なタスクです。よって、「高い誠実性」が最優先です。

一方で、以下のようなタスクの場合は性格特性を付与しないほうが無難かもしれません。

複数条件の吟味が必要な問題の解決
「多段階にわたる推論」と「複雑な問題解決」がメインのタスクのため、性格特性の付与でパフォーマンスが悪化する可能性があります。
薬歴・他職種からの情報を踏まえた複雑な情報の整理
「複雑な問題解決」を中心に、「多段階にわたる推論」と「知識の検索」と「専門知識の評価」が必要になるタスクです。性格特性の付与でパフォーマンスが悪化する可能性があるため、情報の整理自体は性格特性を与えずに実行してもらい、文章を整形する段階で「中〜高レベルの協調性、高い誠実性、低い神経症傾向」の性格特性を付与すると良いかもしれません。

非常にざっくりと言うと、「伝える仕事」「整える仕事」には性格特性の付与がある程度有効で、逆に「深く考える仕事」「計算する仕事」には性格特性を付与しないほうが有効であると考えられます。

参考文献

[1] Digman, J. M. (1990). Personality structure: Emergence of the five-factor model. Annual Review of Psychology, 41(1), 417–440.

[2] Goldberg, L. R. (1990). An alternative “description of personality”: The Big-Five factor structure. Journal of Personality and Social Psychology, 59(6), 1216–1229.

[3] Anglim, J., Dunlop, P. D., Wee, S., Horwood, S., Wood, J. K., & Marty, A. (2022). Personality and intelligence: A meta-analysis. Psychological Bulletin, 148(5–6), 301–336.

[4] DeYoung, C. G. (2015). Cybernetic big five theory. Journal of Research in Personality, 56, 33–58.

[5] Eysenck, M. W., Derakshan, N., Santos, R., & Calvo, M. G. (2007). Anxiety and cognitive performance: Attentional control theory. Emotion, 7(2), 336–353.

[6] Fleming, K. A., Heintzelman, S. J., & Bartholow, B. D. (2016). Specifying associations between conscientiousness and executive functioning: Mental set shifting, not prepotent response inhibition or working memory updating. Journal of Personality, 84(3), 348–360.

[7] de Araujo, P. H. L., Hedderich, M. A., Modarressi, A., Schütze, H., & Roth, B. (2025). Persistent personas? Role-playing, instruction following, and safety in extended interactions.

最後までお読みいただき、ありがとうございました。
Webサイト「薬剤師のためのAIノート」も、是非ご覧ください。

薬剤師のためのAIノート 薬剤師が自信を持ってAIを活用するために pharmacist-ai-notes.jp

記事に関する内容以外のお問い合わせは、以下のフォームよりお願いいたします。

お問い合わせ 各種お問い合わせに関しましては、下記フォームよりお願いします。お問い合わせへの返信は、asiuraiwakan… pharmacist-ai-notes.jp

また、書籍「超知能時代の調剤薬局」発売中です。
Kindle Unlimited会員の方は無料で読むことができます。

超知能時代の調剤薬局 www.amazon.co.jp

700円 (2026年04月18日 00:50時点詳しくはこちら)

Amazon.co.jpで購入する

ダウンロード

copy

いいなと思ったら応援しよう！

チップで応援する

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.

Dev.to

10 ChatGPT Prompts Every Genetic Counselor Should Be Using in 2025

Dev.to

The Memory Wall Can't Be Killed — 3 Papers Proving Every Architecture Hits It

Dev.to

BlueColumn vs Mem0: Which AI Agent Memory API Should You Use?

Dev.to

The Physics Wall in 2026: 3 Papers That Show Why Node Shrinks Won't Save Us

Dev.to

生成AIの「内部」に介入して、性格特性を付与してみると…

Key Points

生成AIの「内部」に介入して、性格特性を付与してみると…

研究の方法

1. 使用されたモデル

2. 評価タスク

3. 性格の付与（NPTI）

結果

1. モデルの種類が変わると

2. モデルのサイズおよびタスクの種類ごとにみた、性格特性の影響の大きさ（感受性）

3. Big Fiveの各特性ごとの影響

4. 人間の性格研究と、どのくらい似ていたのか

5. Dynamic Persona Routing（DPR）

注意点

性格を付与しても、出力の品質が上がるとは限らない

仮に薬剤師の業務で今回の示唆を応用できるとしたら

参考文献

いいなと思ったら応援しよう！

Related Articles

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.

10 ChatGPT Prompts Every Genetic Counselor Should Be Using in 2025

The Memory Wall Can't Be Killed — 3 Papers Proving Every Architecture Hits It

BlueColumn vs Mem0: Which AI Agent Memory API Should You Use?

The Physics Wall in 2026: 3 Papers That Show Why Node Shrinks Won't Save Us

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer