二言語モデルにおける言語横断転移は人間のようか？オランダ語と英語で語形が重なる語を用いた研究

arXiv cs.CL / 2026/4/9

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本研究は、コグネート（friends）と異言語同形異義語（false friends）に焦点を当て、オランダ語・英語の因果的Transformer言語モデルが、人間の二言語読者に見られる言語横断的な活性化パターンと類似しているかどうかを調べる。
研究者らは、共有（または偽の）友語に対して、共有か言語固有かの埋め込みを与えるかどうかを制御する4つの語彙共有レジームの下でモデルを学習し、驚き度（surprisal）と埋め込み類似度の測定によって言語横断効果を検証する。
モデルは概ね言語の分離を保っており、言語横断効果は主に、重なりのある語形の埋め込みが言語間で共有される場合に現れる。
埋め込みが共有されると、モデルは対照条件に比べて、友語だけでなく偽の友語でも促進（facilitation）の挙動を示す。しかし回帰分析では、これらの挙動は一貫した語形から意味への対応づけによるよりも、語の頻度によって主に引き起こされていることが示唆される。
人間らしい質的なパターンが再現されるのは、友語についてのみ埋め込みが共有され、偽の友語については共有されない条件に限られ、語彙の重なりが符号化される方法が、二言語読解の説明としてモデルの適切性を制約していることを示す。

要旨: バイリンガル話者は、読解中に言語間の活性化を示し、特に表層形が共有されている語で顕著に現れる。親類語（friends）は通常促進をもたらす一方で、言語間ホモグラフ（false friends；偽の友語）は干渉、あるいは効果がないことを引き起こす。そこで本研究では、バイリンガル言語モデルにおける言語間の活性化が、これらのパターンをどの程度なぞっているかを検討する。ダッチ語—英語の因果的Transformerを、（偽の）友語が共有されるかどうか、あるいは言語固有の埋め込みを受けるかどうかを操作する4つの語彙共有条件のもとで学習させる。バイリンガル読解研究の心理言語学的刺激を用いて、驚き（surprisal）および埋め込み類似度の分析によりモデルを評価する。その結果、モデルは概ね言語の分離を維持しており、言語間の効果は主として埋め込みが共有されている場合に生じる。これらの場合には、友語（friends）も偽の友語（false friends）も、統制条件に比べて促進を示す。回帰分析の結果、これらの効果は主に、形と意味の対応関係における一貫性ではなく頻度によって駆動されていることが明らかになった。埋め込みを共有するのが友語（friends）だけである場合に限って、バイリンガル話者の質的なパターンが再現される。全体として、バイリンガル言語モデルはいくつかの言語間活性化の効果を捉えている。しかし、人間の処理との整合性は、語彙の重なりがどのように符号化されるかに大きく依存しており、バイリンガル読解を説明するモデルとしては、その説明適切性が制限される可能性がある。

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

日経XTECH

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

日経XTECH

なぜAnthropicの新モデルがサイバーセキュリティの専門家を動揺させているのか

Reddit r/artificial

AI 2027の論文は、いまもなお正当性を持っているのか？

Reddit r/artificial

なぜほとんどの生産性システムが失敗するのか（そして代わりに何をすべきか）

Dev.to

二言語モデルにおける言語横断転移は人間のようか？オランダ語と英語で語形が重なる語を用いた研究

要点

関連記事

データサイエンティストの役割 AIで変わる、分析から「価値創造」へ

ベイシアグループが横断ハッカソン、業務時間の5％を他事業へ割り当て

なぜAnthropicの新モデルがサイバーセキュリティの専門家を動揺させているのか

AI 2027の論文は、いまもなお正当性を持っているのか？

なぜほとんどの生産性システムが失敗するのか（そして代わりに何をすべきか）

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer