大規模言語モデルにおける特徴空間のセマンティック構造
arXiv cs.CL / 2026/5/1
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、大規模言語モデルの隠れ状態におけるセマンティック特徴同士の幾何学的な関係が、人間の心理的連想と非常によく一致することを示します。
- 360語に対応する特徴ベクトルを作成し、32のセマンティック軸(例:美しい–醜い、柔らかい–硬い)に射影したところ、対応するセマンティックスケールに関する人間の評価との間で強い相関が得られました。
- セマンティック軸同士のコサイン類似度が、調査におけるそれらのスケール間の相関の強さを予測できることも示されています。
- さらに、32のセマンティック軸にまたがる分散が低次元の部分空間に集中し、人間のセマンティック連想に見られるパターンが再現されると述べています。
- 1つの軸に沿って単語を操作すると、他の軸にもコサイン類似度に比例した「波及効果」が生じることが示され、特徴は孤立して見るのではなく、幾何学的関係や意味のある部分空間として理解すべきだと結論づけています。




