AI Navigate

ロマンシュ方言の頑健な言語識別

arXiv cs.CL / 2026/3/18

📰 ニュースTools & Practical UsageModels & Research

要点

  • 本論文は、SVMベースのアプローチを用いて、ロマンシュ方言(イディオム)および Rumantsch Grischun を対象とした言語識別システムを紹介する。
  • 本研究は、ロマンシュ方言間の難しい分類と、超地域的な標準形である Rumantsch Grischun の識別を課題の一部として扱う。
  • 本モデルは、二つのドメインにまたがる新たに整備されたベンチマークで評価され、ドメイン内平均精度は97%を達成した。
  • この分類器は公開されており、イディオムを考慮したスペルチェックや機械翻訳などのアプリケーションを可能にする。

要旨: ロマンシュ語には、いくつかの地域的変種があり、それらはしばしば相互理解可能性が限られる。この言語的多様性にもかかわらず、これらのイディオムを識別できる言語識別(LID)システムを構築するための文献化された取り組みが不足している。ロマンシュLIDは、いくつかのイディオムの要素を組み合わせた超地域的な方言であるRumantsch Grischunも識別できるべきであるため、これは新規で興味深い分類問題となる。本論文では、SVMアプローチに基づくロマンシュ語のイディオム用LIDシステムを提案します。私たちは、2つのドメインにまたがる新たに選定されたベンチマークでモデルを評価し、平均的なドメイン内精度が97%に達することを確認しました。これにより、イディオムを意識したスペルチェックや機械翻訳などの応用が可能になります。私たちの分類器は公開されています。