XITE:埋め込みによる転移のためのクロスリンガル補間
arXiv cs.CL / 2026/4/28
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文は、低リソースのターゲット言語からのラベルなしテキストを用いて、多言語言語モデルのクロスリンガル転移を改善するための埋め込みベースのデータ拡張手法「XITE」を提案する。
- XITEは、埋め込み類似度によりタスク固有のコーパス内で英語の対応文を見つけてラベルを付与し、ソースとターゲットの埋め込みを補間して微調整用の合成学習データを生成する。
- 補間の前に、線形判別分析(LDA)でターゲット文を言語豊富な部分空間へ射影することで、性能がさらに向上する。
- XLM-Rを用いた実験では、韓国語・アラビア語・ウルドゥ語・ヒンディー語など多様なターゲット言語で大幅な改善が示され、感情分析で最大35.91%、自然言語推論で最大81.16%の向上が得られる。
- さらに、XITEによる適応は高リソース言語での性能を維持しつつ、忘却を抑えながら転移性能を高めることにも寄与する。




