実世界の算術:Llamaは循環概念を推論するために10進の加算を用いる
arXiv cs.AI / 2026/5/5
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、Llama-3.1-8Bが「6か月後に何月か」のような循環概念をどのように推論するかを調べ、その表現が円環的に構造化されているにもかかわらず、モデルは周期(例:12か月)の上での直接的な合同算術(modular addition)を行わないことを示しています。
- モデルは代わりに、タスクに依存しない汎用の加算メカニズムを使い、まず2つの入力を10進の加算で合計し(例:6+August=14)、その後その合計を循環概念の空間へ写像して答えを得ると考えられます。
- さらに著者らは、この加算の計算にタスク非依存のフーリエ特徴が使われており、月のような循環概念の周期(例:12)ではなく、10進加算に整合する周期(例:2、5、10)を持つことを論じています。
- 機構的には、層18のMLPのうち約0.2%にあたる28個のMLPニューロンが全タスクで再利用されており、それらを互いに交わらないクラスタに分けると、クラスタごとに異なる周期を持つフーリエ特徴の和を計算していることを特定しています。
- 結果として、本研究は因果的な抽象化と特徴量の幾何学の相互作用が、大規模言語モデルの機構的理解(メカニスティックな解釈)を深め得ることを強調しています。




