CommonMorph: 参加型形態論的ドキュメンテーション・プラットフォーム

arXiv cs.CL / 2026/4/7

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • CommonMorphは、既存のワークフローがリソース集約的である低資源言語や多様体に焦点を当て、形態データの収集と注釈付けを効率化するためのオープンソース・プラットフォームとして紹介される。
  • このシステムは、専門言語学者による定義、投稿者(コントリビュータ)からの聞き取り(エリシテーション)、そしてコミュニティによる検証という3層プロセスを採用し、手作業の負担を減らしつつ方法論上の厳密さを維持する。
  • アクティブラーニングと注釈提案を取り込み、関連言語からの素材を取り込み、適応させるためのツールを提供することで開発を加速する。
  • CommonMorphは、屈折的(fusional)、膠着的(agglutinative)、および語根とパターン(root-and-pattern)という複数の形態類型をサポートし、NLPツールとの相互運用性のためにUniMorph互換の出力をエクスポートできる。
  • このプラットフォームは、アクセスしやすい形態論的ドキュメンテーションによって言語の多様性を保全することを目的とした、再現可能な協働技術のアプローチとして提示される。