FusHaからFolkへ：アラビア語言語モデルにおける言語横断転移を探る

arXiv cs.CL / 2026/4/1

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本研究では、主に現代標準アラビア語（MSA）で事前学習されたアラビア語言語モデルが、音声やオンラインの書き言葉で用いられるさまざまなアラビア語の方言へどのように転移するかを調べる。
3つのNLPタスクに対するプロービングと表象類似性分析を用いて、著者らは方言間の転移が可能である一方で、その程度は方言によって大きく異なることを明らかにする。
本論文では、方言がMSAに類似する度合いは、方言地域間の地理的近接性によって部分的に説明できると報告している。
さらに、すべてのアラビア語の方言を同時に支えるようにモデルを学習させた場合に負の干渉が生じるという証拠も示されており、追加学習は一部の方言に対する有効な転移を低下させうることが示唆される。
これらの知見は、アラビア語言語モデルにおける言語横断転移を「全方言」学習戦略がどれほど適切に支えるのかについて懸念を提起する。

Abstract

アラビア語の言語モデル（LM）は主に現代標準アラビア語（MSA）で事前学習されており、その方言へ転移すると期待されています。標準的な書き言葉としてのMSAはフォーマルな場面で一般に用いられる一方で、人々はアラブ地域全体に広がるさまざまな方言でオンライン上では話し、また書いています。アラビア語LMにとっては、方言ごとにMSAとの類似度が異なるため、こうした状況が制約になります。本研究では、3つの自然言語処理（NLP）タスクに対するプロービングと表象（表現）の類似性を用いて、アラビア語モデルのクロスリンガル転移を調査します。その結果、転移は可能であるものの、方言間で不均衡に起こることが分かりました。これは、方言同士の地理的近さによって部分的に説明できることを見出しています。さらに、すべてのアラビア語の方言をサポートするように学習されたモデルには、負の干渉の証拠があることを確認しました。これはそれらの類似度の程度に疑問を投げかけ、アラビア語モデルにおけるクロスリンガル転移について懸念を生じさせます。

Show HN: 1ビット盆栽 — 最初の商用可能な1ビットLLM

Dev.to

詰まったときに自分でツールを書き起こせるAIエージェントを作った

Dev.to

エージェントの自己発見：AIエージェントが自分の財布を見つける方法

Dev.to

[P] フェデレーテッド・敵対的学習

Reddit r/MachineLearning

反転エラー：なぜ安全なAGIには「エナクティブなフロア」と「状態空間の可逆性」が必要なのか

Towards Data Science

FusHaからFolkへ：アラビア語言語モデルにおける言語横断転移を探る

要点

Abstract

関連記事

Show HN: 1ビット盆栽 — 最初の商用可能な1ビットLLM

詰まったときに自分でツールを書き起こせるAIエージェントを作った

エージェントの自己発見：AIエージェントが自分の財布を見つける方法

[P] フェデレーテッド・敵対的学習

反転エラー：なぜ安全なAGIには「エナクティブなフロア」と「状態空間の可逆性」が必要なのか

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer