Budget-Xfer: 低資源アフリカ言語へのクロスリンガル転移のための予算制約付きソース言語選択
arXiv cs.CL / 2026/3/31
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、低資源のアフリカ言語へのクロスリンガル転移において、複数のソース言語を選択し固定の注釈予算を割り当てるための枠組みであるBudget-Xferを提案する。
- ソース選択を、予算制約付きの資源配分問題としてモデル化することで、本研究は言語選択の効果を、総トレーニングデータ量による交絡の影響から切り離すことを目指す。
- ハウサ語、ヨルバ語、スワヒリ語に対する固有表現抽出(NER)および感情分析についての実験(2つの多言語モデルを用いた288回の実行)では、多ソース転移が単一ソース転移を大きく上回り、Cohen’s dは0.80から1.98の範囲となる。
- 著者らは、多ソース配分戦略の中では、性能差は概して小さく、統計的に有意でないことを見出している。
- さらに、選択の代理指標として埋め込み類似度を用いることはタスク依存であり、NERではランダムなソース選択がより良い一方、感情分析では類似度ベースの選択が優れていないことを報告している。




