中国語は「バイブ・コーディング」で英語より効率的ではない:トークンコストと問題解決率に関する予備研究
arXiv cs.CL / 2026/4/17
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- ソーシャルメディアで広まっている「LLMのコーディングでは中国語プロンプトの方が英語よりトークン効率が高く、APIコストを最大40%削減できる」という主張を、SWE-bench Liteを用いて検証した。
- 対象としたモデル全体で、中国語に一貫したトークン効率の優位性は確認されず、言語とトークンコストの関係が単純な前提で成り立つわけではないことが示された。
- トークンコストの結果はモデル依存で、MiniMax-2.7では中国語プロンプトでトークン使用量が増える一方、GLM-5では中国語プロンプトでトークン数が減るなど、モデルのアーキテクチャが影響している。
- 重要な点として、性能面では中国語プロンプトの成功率が概して英語より低く、成功に至ったタスクあたりの期待コスト(トークン消費と解決率を同時に考慮)でも同様の傾向が見られた。
- モデル数やベンチマークが限られているため結論は暫定的であり、実務者は「プロンプト言語を中国語に変えるだけで」コスト削減や性能向上が得られると期待しない方がよいと示唆されている。



