FusHaからFolkへ:アラビア語言語モデルにおける言語横断転移を探る
arXiv cs.CL / 2026/4/1
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本研究では、主に現代標準アラビア語(MSA)で事前学習されたアラビア語言語モデルが、音声やオンラインの書き言葉で用いられるさまざまなアラビア語の方言へどのように転移するかを調べる。
- 3つのNLPタスクに対するプロービングと表象類似性分析を用いて、著者らは方言間の転移が可能である一方で、その程度は方言によって大きく異なることを明らかにする。
- 本論文では、方言がMSAに類似する度合いは、方言地域間の地理的近接性によって部分的に説明できると報告している。
- さらに、すべてのアラビア語の方言を同時に支えるようにモデルを学習させた場合に負の干渉が生じるという証拠も示されており、追加学習は一部の方言に対する有効な転移を低下させうることが示唆される。
- これらの知見は、アラビア語言語モデルにおける言語横断転移を「全方言」学習戦略がどれほど適切に支えるのかについて懸念を提起する。



