機械の個性:大規模言語モデルにおける真の癖と応答バイアスを切り分ける

arXiv cs.AI / 2026/4/21

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、大規模言語モデルの行動の違いが、刺激に特有の「個性」を反映するのか、それとも全体的な応答バイアスやランダムなノイズによるものなのかを検証する。
  • 10のオープンウェイトLLMに対して、100,000語超・14の心理言語指標にわたる74.9百万件の評価データを用い、心理測定で用いられる交差ランダム効果モデルにより要因分解を行った。
  • 平均して分散の16.9%が刺激特異的な個性に起因すると推定され、統計的なヌルモデルを頑健に上回ることが示された。
  • 指標をまたいだ予測分析により、この個性が各モデルに固有な、首尾一貫した「指紋」になることが明らかになった。
  • 著者らは、応答バイアスや確率的な変動では説明できないLLM間の個体差を「machine individuality(機械の個性)」と呼ぶことを提案している。