Gemma 4 12Bとは?

Dev.to / 2026/6/4

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • Googleは2026年6月3日にGemma 4 12Bをリリースしました。これは、テキスト・画像・音声・動画を入力しテキストを出力する、オープンウェイトの11.95Bパラメータのマルチモーダルモデルです。
  • 多くのマルチモーダルモデルが別々に視覚エンコーダや音声エンコーダを用意するのに対し、本モデルはエンコーダ不要の統一型アプローチで、画像パッチと音声波形を直接モデル経路に投入します。
  • これにより、開発者は単一の12Bモデルのチェックポイントで複数モダリティの入力を扱え、デプロイの簡素化や完全オフライン実行がしやすくなる可能性があります。
  • Gemma 4 12BはApache 2.0で提供され、ローカル実行は16GBメモリ環境(4-bitなら約8GB)を想定し、ベースモデルに加えてチャット向けの命令チューニング版(gemma-4-12B-it)も用意されています。
  • この記事は、Gemma 4 12Bの位置づけや設計がローカルなマルチモーダル・ワークフロー構築に与える影響について解説しています。

この記事の続きは原文サイトでお読みいただけます。

原文を読む →