スパース自己符号化器と、大規模言語モデルに関するホリズム
arXiv cs.AI / 2026/3/30
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、大規模言語モデルが「メタセマンティック」な見方、すなわち単語や複雑な表現が意味を獲得する仕組みに関する捉え方を含意しているのかどうかを問いかける。
- LLMが分布意味論を通じて意味をホリスティックに捉える、という先行する議論を概観しつつ、機械論的解釈可能性がその見方に挑戦し得る点を指摘する。
- さらに、スパース自己符号化器による近年の知見を紹介し、LLMの埋め込み空間内に解釈可能な潜在特徴が多数存在することを示す。そのことが、意味をより分解的に解釈することを動機づける。
- 著者はその後、これらの特徴の性質を分析し、関連する特徴が数え上げ可能であれば、ホリズムはなお成立し得ると結論づける。




