バベルの塔で迷子に:LLMにおける偶発的な多言語性がもたらす悪影響
arXiv cs.CL / 2026/5/5
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、現代の多言語NLPが「偶発的な多言語性(incidental multilingualism)」という脆くて誤解を招きやすい前提に収束しており、LLMが多言語に見えるのは多言語・多文化の能力を中核目標として設計していないためだと主張している。
- その結果として、言語ごとに不均衡で脆く、かつ不透明な挙動が体系的に生じ、複数の言語状況で推論・計画・行動を要する実世界のエージェント的な展開において深刻な帰結につながるとしている。
- 著者らは、(1)モデルが自己申告する対応言語と(2)多言語プロンプト下で実際に応答できる言語を比較する、2つの実用的な問いに焦点を当てた実証研究を行っている。
- さらに、単純な言語変更攻撃によってこれらの失敗が表面化し、LLMベースのシステムに潜む「言語」への隠れた前提を暴露できることを示している。
- それに対し、研究課題として「設計による多言語性(multilingualism by design)」への転換を求めており、公平な多言語性能・文化的な基盤づけ・クロスリンガルな行動理解をモデルパイプラインの第一級目標として扱うべきだとしている。




