要旨: LLMは機械翻訳において有能であることが示されつつありますが、その生成的な性質ゆえに、さまざまな形で過剰生成してしまう場合があります。これらの過剰生成は、NMTで見られる「神経ノイズ(neurobabble)」とは異なり、LLMによる自己説明から、危険な取り違え(コンファブレーション)に至るまで、あるいは適切な説明に至るまで、多岐にわたります。そこでは、LLMが人間の翻訳者のように振る舞うことで、対象となる読者の理解をより深めることができます。過剰生成の正確な性質を検出し、それを特定することは難しい課題です。私たちは商用環境での取り組みにおいて探ってきたさまざまな戦略を詳述し、結果を提示します。
制作(ファブリケーター)か、それとも動的トランスレーターか?
arXiv cs.CL / 2026/4/17
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLMが機械翻訳に有効である一方で、生成的性質により従来のNMTとは異なる形で「過剰生成」が起こりうることを示し、その実態を検討しています。
- 過剰生成は、無害な自己説明や適切な補足から、危険で誤解を招くような捏造(confabulation)まで幅広い形に及びます。
- 著者らは、過剰生成の内容が文脈に応じて適切だったり問題だったりするため、それが「正確にどの種類の過剰生成なのか」を見分けるのが難しいと述べています。
- 商用環境で試した複数の戦略を紹介し、ターゲットとなる読者の理解を高めるために、それらの結果を報告しています。
- 全体として、LLM翻訳における追加生成が妥当で安全かどうかによって、「制作(でっち上げ)」なのか「動的な翻訳」なのかが分かれる、という見方を提示しています。



