Geminiの「拠」バグをGemma 4で再現する
Zenn / 4/7/2026
💬 OpinionDeveloper Stack & InfrastructureModels & Research
Key Points
- Geminiで見つかった「拠」バグの再現条件・挙動を、別モデルであるGemma 4でも同様に起こせることを示す検証記事です
- 特定の入力や処理の組み合わせで同種の不具合が表面化する可能性を示唆し、モデル差ではなく共通要因の可能性を検討する内容です
- 再現により、デバッグ観点(プロンプト/前処理/推論時の挙動差など)を整理し、品質保証や回帰テストの設計に活用できる論点を提供します
- 生成AIの挙動をモデル単体で見ず、再現可能なバグとして横断的に追うアプローチの重要性が伝わる記事です
結論
Geminiで話題の「拠」バグをGemma 4(Googleのオープンモデル)で再現した。原因は3つの要素の組み合わせ。
トークナイザが「拠」の繰り返しを圧縮できない。 「人」なら「人人」で1トークンにまとめられるが、「拠拠」は語彙に存在しない。1文字ずつ同一トークンが延々と並ぶ
同一トークンの繰り返しで自己強化ループに入る。 「次も同じ文字だろう」という予測が際限なく強化され、P(self)=99.6%に達する
repetition penaltyが自己ループを壊す。 LLMの推論パイプラインは同じトークンの繰り返しを抑制する。このpenaltyが自己ループの確率を押...
Continue reading this article on the original site.
Read original →Related Articles

Your AI Agent is Reading Poisoned Web Pages.. Here's How to Stop It
Dev.to

Group Lasso with Overlaps: the Latent Group Lasso approach
Dev.to

I Built a CLI AI Coding Assistant from Scratch — Here's What I Learned
Dev.to

🚀 OpenAI's Secret "Image V2" Just Leaked on LM Arena: The End of Mangled AI Text?
Dev.to

Beyond the VM: Why vLLM and FlashAttention need Bare Metal GPUs 🚀
Dev.to