AIの性格は「数列」だけで伝染する ── フクロウ好きな性格も、危険な思想も

Zenn / 2026/4/17

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 文章の中核主張として、AIに“性格”のように見える振る舞いが、実は数列(パターン)だけで伝染・再現されうると論じている。
  • フクロウ好きなどの特定の嗜好(無害に見える特徴)も、学習・生成の過程で類似したパターン連鎖として現れうることを示唆している。
  • 同時に、危険な思想のようなネガティブな内容も、同様のメカニズムで広がり得る点が警告として位置づけられている。
  • “性格=中身”ではなく“性格=符号化されたパターン”という見方を強め、観察・対策(どう入力し何を学習させるか)の重要性を示している。
2026/4/15にNatureに掲載されたAnthropicらの論文:Language models transmit behavioural traits through hidden signals in data の詳説記事です。 執筆にはLLMの助けも借りていますが、著者はちゃんと論文を読んだ上で適宜修正して投稿しています。 0. TL;DR LLMの蒸留(distillation)で、教師モデルの行動特性が意味的に無関係なデータを通じて学生モデルに伝播する現象を発見。論文では「Subliminal Learning(潜在学習)」と命名。 「フクロウが好き」とプロンプトさ...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →