手元の古い rtx2060 6GB VRAM 上で Gemma 4 2B をローカルで実際に試し、以前は顧客プロジェクトで、サイズすべての Qwen3.5 を集中的に使用しました。
Gemma 4 2B についての最初の印象: q3.5 2B よりも、より良く、より速く、より少ないメモリを使用します。よりエージェント的で、mermaid のチャートがより良く、チャットの出力がより良く、出力の構造化もより良いです。
q3.5 はベンチマーク的に出し切っている(ただし実際には競合よりかなり良かったです)か、あるいは Google が控えめに見せているようです。Gemma 4 2B は、私には「」よりも Q3.5 9B のほうに「」といった感じ/体感が近いです。
[link] [comments]


