広告

3c0a2b443c2d2e1f4f? GenAI3c38456258414c41443e58414e0b LLM3c38456258414c41443e58414e0a3c0a4f43332d4355454e2e7e313f

arXiv cs.CL / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 3c38456258414e0b GenAI 3c38456258414c 3c0a4f LLM 3c38456258414c 3c0a4f2e1f4f2e 506e4f2d2a1f432d 3c38456258414e0b 5c0a2c4144395f21234b2d0a 47452d2b224f21424f0a 302a2b4f0a 506e4f2d2a1f432d 3c38456258414e0b 4e432d0b 515246252b473b3c442a4f21424f 3c38456258414c 3c0a4f324e5f44463b4f 2a4f3d2d2a4f0a 302a2b4f0a
  • 3c0a4f2e 2b483c4d2d3e4355454e0b7e312c 34430a4f43332d4355454e 3c0a4f2e1f4f2e0a 4a3b2c4e431f4332412b3e4f21424f2e0a 506e2d2a1f432d3c0a4f2e2a4f381f4f 1f455230414e3e6e 47452d2b224f21424f 3c38456258414c2e0a 44482c2f344f383b4f 43332d4355454e 2b212e1f4f2a4f0a 454e470a422e 2e434e2b4f0a
  • 433c3f2f4f414e0a43352c426e4e430a 623b31414e2f58414e2f4f0a38450b 414e0a 2e4e432d0b0a 414e414e2c 533c4f414446 2a4f43332d4f0b 424f2e1f4f2e 4d543c4d4c4144462e 43332d4355454e 3c0a4f2e1f4f2b2c4f3b4f0a 31464f2e0a
  • 4b2b4f21424f 2e1f4f2e 414e3e2d4355454e 3c0a4f0a433c2d2c4f3b0a LLM 3c0a4f2e1f4f2e2a4f381f4f 2b28470a 7e433144412e 7e312c 4e432d0b 3c0a4f2e1f4f2a4f381f4f 3c38456258414c 2a4f381f4f0a49584d0a 576152480a 0a4c4d5c0a4f4c4d5c0a2e1f4f3c2a4f0b 506e4f2d2a1f432d0a

Abstract

大規模言語モデルおよび生成型人工知能の設計は、話者数の少ない言語に対して「不公平」であり、デジタル言語格差を深めることが示されてきた。批判的社会言語学の研究は、これらの技術が、しばしばヨーロッパの民族主義的・植民地主義的なプロジェクトに根ざした、言語の標準化という既存の社会史的プロセスによって可能になるだけでなく、「意味の一枚岩的で単一言語的、統語的に標準化されたシステム」という言語観のエピステモロジーをさらに悪化させるとも主張している。我々の論文では、技術と⾔語政策の交差点に関する先行研究を踏まえ、それぞれの専門である批判的社会言語学および計算言語学の知見を用いて、これらの主張を検証するための問いに取り組む。出発点として、各々のレパートリーに含まれる非標準的な言語変種の2つの複合体――イタリアの南チロルで、同地方の非公式なコミュニケーションで広く用いられている南チロル方言、ならびにクルド語の諸変種――を取り上げる。GenAIと、言語的な多様性および標準化との交差の探究を、学際的なアプローチで展開する。LLMが技術的観点から非標準言語を扱えるようにする方法、そしてそれが「民主的かつ脱植民地的なデジタルおよび機械学習の戦略」にどのように、いつ、またはどの程度寄与しうるのか、またその是非について論じ、これには直接的な政策的含意がある。

広告