いまもアクセントは聞こえるのか?LLM時代における母語シグナルの回復力を調査する
arXiv cs.AI / 2026/4/13
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、機械翻訳からLLMベースの文章支援への移行が、ACL Anthologyにおいて母語識別(NLI)シグナルを追跡することで、学術的な文章を均質化しているのかどうかを検討し、3つの時期にわたり分析する。
- 半自動のラベリング手法と、著者の背景に由来する「言語的フィンガープリント」を検出するために微調整した分類器を用いた結果、全体としてNLIの性能は時間とともに低下しており、母語の手がかりが弱まっていることを示唆する。
- ポストLLM期では一様ではない挙動が見られ、中国語とフランス語は、より広範な低下傾向と比べて異常な回復力、または分岐したNLI傾向を示す。
- 一方で、日本語と韓国語は、NLIの検出可能性の低下が想定以上に急であり、LLM時代における言語固有の影響が示される。
- これらの結果は、LLM(および関連する文章作成ワークフロー)が、言語ごとに異なる形で観測可能な母語の変動を低減し得ることを示しており、文章の真正性や著者の推論に関する研究に影響を与える可能性がある。




