Geminiの「拠」バグをGemma 4で再現する

Zenn / 2026/4/7

💬 オピニオンDeveloper Stack & InfrastructureModels & Research

要点

  • Geminiで見つかった「拠」バグの再現条件・挙動を、別モデルであるGemma 4でも同様に起こせることを示す検証記事です
  • 特定の入力や処理の組み合わせで同種の不具合が表面化する可能性を示唆し、モデル差ではなく共通要因の可能性を検討する内容です
  • 再現により、デバッグ観点(プロンプト/前処理/推論時の挙動差など)を整理し、品質保証や回帰テストの設計に活用できる論点を提供します
  • 生成AIの挙動をモデル単体で見ず、再現可能なバグとして横断的に追うアプローチの重要性が伝わる記事です
結論 Geminiで話題の「拠」バグをGemma 4(Googleのオープンモデル)で再現した。原因は3つの要素の組み合わせ。 トークナイザが「拠」の繰り返しを圧縮できない。 「人」なら「人人」で1トークンにまとめられるが、「拠拠」は語彙に存在しない。1文字ずつ同一トークンが延々と並ぶ 同一トークンの繰り返しで自己強化ループに入る。 「次も同じ文字だろう」という予測が際限なく強化され、P(self)=99.6%に達する repetition penaltyが自己ループを壊す。 LLMの推論パイプラインは同じトークンの繰り返しを抑制する。このpenaltyが自己ループの確率を押...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →