広告

絶滅危惧にあるスラブ系の言語変種に対する転移学習:接触によって形作られた方言間でのポマクにおける依存関係解析

arXiv cs.CL / 2026/3/31

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、方言差が大きく標準化が限られている絶滅危惧の東南スラブ系言語であるポマクに対して、新たな研究リソースと基礎的な依存関係解析(dependency-parsing)実験を提示する。
  • 方言間の転移を検証するために、主としてギリシャの変種に由来するポマクのユニバーサル依存関係ツリーバンクでパーサを学習し、トルコ(ウズンキョプリ)の変種でゼロショット性能を評価する。
  • 本研究は、ゼロショット転移において、方言間の音韻論的および形態統語的な差異が解析精度にどの程度影響するかを定量化する。
  • 新たに、トルコの変種におけるポマクの手動アノテーション付きコーパス(650文)を公開/使用し、少量データであっても、狙いを定めたファインチューニングによって大幅な精度向上が得られることを示す。
  • 両方言からの方言横断的転移学習を組み合わせることで、ファインチューニング単独よりも性能がさらに向上する。

広告