要旨: 創造的な思考は人間の認知の根本的な側面であり、発散的思考――新しく多様なアイデアを生み出す能力――は、その中核となる生成エンジンだと広く考えられています。大規模言語モデル(LLM)は、発散的思考テストにおいて最近、目を見張る性能を示しており、先行研究では、タスクの成績が高いモデルほど人間の脳活動により整合的である傾向があることが示されています。しかし、既存の脳-LLM整合研究は、受動的で非創造的な課題に焦点を当ててきました。ここでは、170人の参加者が代替用途課題(Alternate Uses Task: AUT)を行った際のfMRIデータを用いて、創造的思考中の脳整合を探究します。サイズが異なるLLM(270M-72B)から表現を抽出し、表現の類似性分析(Representational Similarity Analysis: RSA)により、創造性に関連するデフォルトモードネットワークおよび前頭頂ネットワークへの整合を測定します。その結果、脳-LLM整合はモデルサイズ(デフォルトモードネットワークのみ)およびアイデアの独創性(両ネットワーク)に応じてスケールし、効果は創造プロセスの初期段階で最も強いことが分かりました。さらに、事後学習の目的は、機能的に選択的な方法で整合を形成することを示します。すなわち、創造性に最適化された exttt{Llama-3.1-8B-Instruct} は高い創造性を示す神経応答との整合を維持する一方で、低い創造性を示す応答との整合を低下させます。また、人間の行動で微調整されたモデルは両方で整合を高め、推論で学習した変種は逆のパターンを示します。これは、チェイン・オブ・ソート(逐次的思考)学習が、創造的な神経幾何(geometry)から表現を遠ざけ、分析的処理へと導くことを示唆しています。これらの結果は、事後学習の目的が、人間の創造的思考の神経幾何に対して、LLMの表現を選択的に再構成することを示しています。
大規模言語モデルは創造的思考中に人間の脳と整合する
arXiv cs.CL / 2026/4/7
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本研究では、代替用途課題(Alternate Uses Task)を行う170人の参加者から得たfMRIデータを用いて、大規模言語モデル(LLM)の表現が創造的思考中の人間の脳活動とどのように整合するかを、表象類似性分析(RSA)によって調べる。
- 脳-LLMの整合性は、LLMの規模(特にデフォルト・モード・ネットワーク)と、アイデアの独創性(デフォルト・モード・ネットワークおよび前頭頂ネットワークの両方)に応じてスケールすることが示される。また、整合性の効果が最も強く現れるのは、創造プロセスの初期である。
- 学習後の目的(post-training objectives)の違いにより、整合性には機能選択的な変化が生じる。すなわち、創造性最適化を目指したLlamaの派生モデルは、高い創造性に対応する神経応答との整合性を維持する一方、低い創造性に対応する整合性を弱める。
- 人間の行動に合わせて微調整されたモデルは、高創造性および低創造性の両方に対応する神経応答との整合性を高める。一方で、推論(reasoning)訓練を行った派生モデルは、創造に関わる神経幾何(creative neural geometry)から離れて、より分析的な処理パターンへ整合性を移行させる。




