要点

Google DeepMindは、Gemma 4ファミリーとして、Apache 2.0ライセンスの新しい視覚対応の推論LLMを4つ（2B、4B、31B、そして26B-A4Bの混合専門家モデル）発表しました。
今回のリリースは「パラメータあたりの知能（intelligence-per-parameter）」を強調しており、Per-Layer Embeddings（PLE）という手法を用いることで、デコーダ層ごとにトークン参照テーブルを使い、より効率的なオンデバイス展開を狙っています。
システムカードの重要な詳細として、より小型のモデル（E2B/E4B）における「E」は、PLE埋め込みの使い方によって総パラメータ数よりも低くなる「effective（有効）」なパラメータ数を指すことが挙げられます。
ブロガーは、LM StudioでGGUFファイルを用いてモデルをテストし、2B、4B、26B-A4Bは動作すると報告しています。一方で31Bモデルは、プロンプトに対して「---」を出力し続けるループが発生しており、分配（配布）/互換性の問題の可能性を示唆しています。
この記事は、Gemma 4をより広い初期トレンドの一部として位置付けています。すなわち、小型で高能力なオープンモデルが急速に進歩していること、そして実運用のためのパラメータ効率の高い設計が進んでいることです。

Simon Willison’s Weblog

スポンサー: WorkOS — エンタープライズ向けに販売する準備はできていますか？ WorkOSで安全に構築して提供しましょう。

2026年4月2日 - リンク・ブログ

Gemma 4: バイト単位で、最も能力の高いオープンモデル。Google DeepMindによる、視覚対応の新しいApache 2.0ライセンスの推論LLMが4つ登場しました。サイズは2B、4B、31B。そして26B-A4BのMixture-of-Expertsです。

Googleは「パラメータあたりの知能の前例のないレベル」を強調しており、小さくて役に立つモデルを作ることが、まさに今もっとも熱い研究分野の一つであることを裏付けるさらなる証拠が示されています。

彼らは実際に、2つの小さいモデルを「Effective（有効）な」パラメータサイズのためにE2BとE4Bと名付けています。システムカードにはこう書かれています:

小型モデルは、オンデバイスの展開におけるパラメータ効率を最大化するためにPer-Layer Embeddings（PLE）を取り入れています。モデルにさらに層やパラメータを追加するのではなく、PLEは各デコーダ層に対して、すべてのトークンごとにそれ自身の小さな埋め込み（embedding）を与えます。これらの埋め込みテーブルは大きいものの、すぐに参照するためにだけ使われます。そのため、総パラメータ数に比べて有効なパラメータ数はずっと小さくなります。

私はそれを完全には理解できていませんが、どうやらE2Bの「E」がそういう意味だということです！

LM Studioで、このGGUFを使って試してみました。2B（4.41GB）、4B（6.33GB）、26B-A4B（17.99GB）モデルはいずれも完全に動作しましたが、31B（19.89GB）モデルは壊れていて、試したすべてのプロンプトに対して"--- "をループで吐き出しました。

2Bから4Bから26B-A4Bへと続くpelican品質の上昇が注目に値します:

E2B:

茶色い長方形の上に青い丸が2つ、そしてペリカン用の変なオレンジの塊と黄色い三角

E4B:

黒い車輪が、ある種のグレーのサーフボードでつながっており、その上に浮かぶ青い塊。ペリカンは半円になっている

26B-A4B:

自転車には必要なパーツは揃っているものの、フレームが少し歪んでいる。ペリカンは本当に良い。大きな三角のくちばしと、きれいにカーブした首を持っていて、明らかに自転車に座っている鳥

（このモデルは実際にSVGエラーがありました――「18行目、88列目でAttribute x1が再定義されています」――が、それを直した後、ノートPCで動くモデルとしては、これまで見た中でたぶん最良のペリカンが出ました。）

Googleは、2つのより大きいGemmaモデルについて、AI Studio経由でAPIアクセスを提供しています。私はllm-geminiに対応を追加し、その後、同じ方法で31Bモデルを使ってpelicanを実行しました:

llm -m gemini/gemma-4-31b-it '自転車に乗っているペリカンのSVGを生成する'

かなり良いです。ただし自転車のフレーム前部が欠けています:

モーションブラーの線。ほぼ素晴らしい自転車ですが、フレームの前部が欠けています。ペリカンは良い感じです。

2026年4月2日午後6時28分投稿

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 4/3Dailyインサイトを見る →

Gemma 4：バイト単位で、最も高い能力を備えたオープンモデル

要点

Simon Willison’s Weblog

最近の記事

月間ブリーフィング

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

フィジカルAIに沸く建設業、i-Constructionの教訓生かしプロセス変革に踏み込め

SaaSは「死なない」 AIエージェント取り込み、管理・運用が競争軸に

話題のコンテキストエンジニアリング、日本企業が後れを取る根深い理由

暗黙知をAIに学ばせただけでは形式知にならない

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer