多言語言語モデルは言語構造よりも文字体系(スクリプト)を符号化する

arXiv cs.LG / 2026/4/8

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、多言語言語モデルが内部表現をどのように形成するかを分析し、それが抽象的な言語の同一性/類型論(typology)によって整理されているのか、それとも表層形(surface-form)の手がかり、例えば表記(orthography)によって組織化されているのかを検証する。
  • 言語活性化確率エントロピー(LAPE)指標とスパース自己符号化器(Sparse Autoencoders)を、圧縮して蒸留した Llama-3.2-1B および Gemma-2-2B のコンパクト版に適用したところ、表記が表現構造を支配していることが分かった。
  • ローマ字化(romanization)は、ネイティブの文字体系入力とも英語ともよく整合しない、ほぼ互いに交わらない内部表現をもたらし、表層形の変化に対する強い感度を示している。
  • 語順のシャッフル(並べ替え)は、内部の「言語に関連するユニット」がどれだけ活性化されるかに与える影響が限定的であり、類型論的な語順がユニットの同一性を主に決めているわけではないことを示唆する。
  • 研究では、類型論的情報がより深い層でよりアクセスしやすくなる一方、因果的介入(causal interventions)によれば生成は、表層形の摂動に不変なユニットにより依存しており、類型論的整合だけで選ばれたユニットにはより依存しないことが示される。

Abstract

多言語言語モデル(LM)は、類型論的および正書法的に多様な言語の表象を、共通のパラメータ空間へと整理するが、その内部の組織化のあり方は依然として不明である。本研究では、多言語表象を形作る要因が、抽象的な言語同一性なのか、それとも表層形の手がかりなのか、どちらにあるのかを調べる。表象上のトレードオフが明示的な、小型で蒸留されたモデルに焦点を当て、Language Activation Probability Entropy(LAPE)という指標を用いてLlama-3.2-1BおよびGemma-2-2Bにおける言語関連ユニットを分析し、さらにスパース自己符号化器(Sparse Autoencoders)によって活性を分解する。その結果、これらのユニットは正書法に強く条件づけられていることがわかる。すなわち、ローマ字化は、母語の文字体系への入力とも英語とも整合しない、ほぼ切り離された表象を誘発する一方で、語順のシャッフルはユニットの同一性に与える影響が限定的である。探索(probing)によると、類型論的構造はより深い層でますますアクセス可能になることが示される。また、因果的介入(causal interventions)では、生成が、表層形の摂動に対して不変なユニットに対して最も敏感であり、類型論的整合だけで同定されるユニットに対してではないことが示唆される。全体として、本研究の結果は、多言語LMが表層形を中心に表象を組織化しており、言語的抽象化は統一的な中間言語(interlingua)へと崩壊することなく、段階的に現れてくることを示している。