広告

分布意味論の観点から捉えるポーランド語の音韻論と形態論

arXiv cs.CL / 2026/4/3

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、分布意味論を用いて、ポーランド語の音韻的およびモルフォノロジー(形態音韻論)的な構造が意味埋め込み空間に反映されているかを検証し、とくに子音連結および複雑な語形に焦点を当てる。
  • t-SNE、線形判別分析(Linear Discriminant Analysis)、識別的学習といった手法による実験の結果、埋め込みには、格・性・数・時制・相といった形態統語的特徴だけでなく、音素列のパターンなどの語よりも下位の情報もエンコードされていることが示される。
  • 本研究は、埋め込みから、表層形を明示的に用いることなく、音韻論的な複雑性、形態論的な透明性、利用可能な形態統語的カテゴリーを予測できると報告する。
  • 意味空間と形式空間の間に強い構造的対応関係があることから、埋め込みに基づく識別的レキシコン(語彙)モデルは、理解および産出に対して非常に高精度な予測を支えることができると論じる。

広告