言語・場所・ソーシャルメディア:ニュージーランドにおける地理的方言のアラインメント

arXiv cs.CL / 2026/4/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、ニュージーランド関連のRedditコミュニティにおいて、ユーザーの「場所」に対する認識と地理的方言がどのように一致(アライン)するのかを調べます。
  • ユーザーの認識に関する質的分析と、語彙・形態統語・意味の変数を用いた計算的分析を統合し、言語変化を追跡します。
  • 結果として、人々は概して言語を場所と結びつけること、また場所に関係するコミュニティは連続したスピーチ・コミュニティを形成しやすいことが示されますが、方言コミュニティと場所関連コミュニティの対応関係は複雑になり得ます。
  • 静的および通時的なWord2Vec言語埋め込みを含む高度な言語モデリングにより、場所に基づくコミュニティ間での意味の違いと、ニュージーランド英語における意味の重要な変化が捉えられました。
  • 4.26B語(未処理)の巨大コーパスを新たに作成しており、今後の社会言語学研究に活用できる資源となることが期待されます。

Abstract

本論文は、場所に基づく情報に触発されたソーシャルメディア共同体における地理的方言の整合性(アラインメント)を調査し、とりわけニュージーランドに関連するRedditコミュニティに焦点を当てる。ユーザーの認識に関する質的分析と計算手法を統合することで、本研究は、言語使用が場所アイデンティティをどのように反映するか、またユーザーが示す語彙的・形態統語的・意味的な変数に基づいて、言語の変異と変化のパターンがどのように現れるかを検討する。その結果、ユーザーは概ね言語を場所と結び付けており、場所に関連するコミュニティは連続した発話共同体を形成することが示された。一方で、地理的方言コミュニティと場所に関連するコミュニティとの間の整合性は、依然として複雑である。静的および通時的(diachronic)なWord2Vec言語埋め込みを含む高度な言語モデリングにより、場所に基づくコミュニティ間で意味の変異が明らかになり、ニュージーランド英語の内部で意味の有意な移り変わりが観察された。本研究では、未処理の語を42億6,000万語含むコーパスの作成を行い、今後の研究にとって有用な資源を提供する。総じて、本結果は、社会メディアを社会言語学的探究のための自然な実験場として活用できる可能性を示している。