エスペラントのためのオープン機械翻訳

arXiv cs.CL / 2026/4/1

💬 オピニオンSignals & Early TrendsModels & Research

共有:

要点

この論文は、オープンソースの機械翻訳システムに対するエスペラントの最初の包括的評価であると称し、ルールベース手法、エンコーダー・デコーダー型モデル、そしてLLMを、さまざまなモデル規模にわたって比較している。
英語、スペイン語、カタルーニャ語、エスペラントの6つの翻訳方向について、機械評価指標と人手による評価の両方で翻訳品質を評価する。
結果は、NLLBモデルファミリーが、言語ペア全体で最も良好な総合性能を示すことを示しており、コンパクトに訓練されたモデルと、微調整された汎用LLMがそれに僅差で続く。
人手評価は概ね自動評価指標と一致し、対比較の約半分でNLLBが好まれる一方で、依然として目立つ翻訳誤りが見られる。
著者らはコードと最も性能の高いモデルを公開し、エスペラントMTに関するさらなるオープンかつ共同的な研究を支援している。