Google、推測デコーディングを用いてGemma 4ファミリー向けのMTP(Multi-Token Prediction)ドラフターを導入—最大3倍の高速化を実現
この記事 Google AI Releases Multi-Token Prediction (MTP) Drafters for Gemma 4: Delivering Up to 3x Faster Inference Without Quality Loss は、MarkTechPost に初めて掲載されました。
MarkTechPost / 2026/5/6
Google、推測デコーディングを用いてGemma 4ファミリー向けのMTP(Multi-Token Prediction)ドラフターを導入—最大3倍の高速化を実現
この記事 Google AI Releases Multi-Token Prediction (MTP) Drafters for Gemma 4: Delivering Up to 3x Faster Inference Without Quality Loss は、MarkTechPost に初めて掲載されました。