多言語言語モデルにおける計算上の病変:共有と言語固有の脳アライメントを分離する

arXiv cs.CL / 2026/4/14

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、脳における多言語の言語処理表現がどのように形成されるかを、6つの多言語LLMを神経メカニズムの制御可能な代理として用いて検討する。
  • 研究者らは、言語間で共有されるパラメータ、または特定の1言語に固有のパラメータをゼロ化することで、狙いを定めた「計算上の病変(computational lesions)」を導入し、そのモデルの振る舞いを人のfMRIと比較する。
  • コンパクトな共有コアに病変を与えると、全脳のエンコーディング相関が急激に低下(60.32%減)し、脳のアライメントにおける共有パラメータの因果的役割が示される。
  • 言語固有の病変では埋め込み空間における言語間の分離は保たれる一方で、母語/対応する言語に対する脳の予測可能性が低下し、埋め込みにおける専門化(specializations)が示唆される。
  • 結果は「共有バックボーンに言語別のコンポーネントを組み合わせる」枠組みを支持し、多言語の脳—モデル対応(アライメント)研究に対する因果的アプローチを提案する。

Abstract

脳が言語を異なる言語間でどのように支えているのかは、神経科学における基本的な問いであり、多言語人工知能にとっても有用なテストである。神経画像法は、言語に応答する脳領域を言語横断で同定してきたが、それだけでは、基盤となる処理が共有されているのか言語固有なのかを自ら示すことはできない。ここでは、6つの多言語の大規模言語モデル(LLM)を制御可能なシステムとして用い、言語をまたいで重要な小さなパラメータ集合、または特にある1言語にとって重要なパラメータ集合をゼロにすることで、狙いを定めた「計算上の損傷(computational lesions)」を作成する。次に、損傷のないモデルと損傷を与えたモデルを、母語の英語・中国語・フランス語で、自然な物語の聴取を100分間行っている間の機能的磁気共鳴画像法(fMRI)応答を予測することにおいて比較する(112名の参加者)。コンパクトな共有コアを損傷すると、損傷のないモデルに比べて全脳の符号化相関が60.32%低下する。一方で、言語固有の損傷は埋め込み空間における言語間の分離を維持するが、対応する母語の言語についての脳の予測可能性を選択的に弱める。これらの結果は、組み込まれた専門化を伴う共有のバックボーンを支持し、多言語の脳—モデル整合を研究するための因果的枠組みを提供する。