[Gemma 4](INSET_PAPER_LINK) は、事前学習済みおよび指示チューニング済みのバリアントを備えたマルチモーダルモデルで、パラメータ数が 1B、13B、27B のモデルが用意されています。アーキテクチャは、以前の Gemma バージョンとほぼ同じです。主な違いは、固定トークン予算の範囲で画像を出力できる視覚プロセッサと、高さおよび幅の軸にまたがって視覚向けの情報をエンコードするための空間 2D RoPE です。
すべてのオリジナルの Gemma 4 チェックポイントは、[Gemma 4](https://huggingface.co/collections/google/gemma-4-release-67c6c6f89c4f76621268bb6d) のリリース内にあります。
[リンク] [コメント]



