AI Navigate

インサイト最新記事一覧 AI大全

広告

驚きです（Gemma 4の結果）

Reddit r/LocalLLaMA / 2026/4/5

💬 オピニオンSignals & Early TrendsModels & Research

原文を読む →

共有:

要点

この投稿では、ローカルのQ4_K_M環境で「Gemma 4 31B（think）」を比較したとされるベンチマーク結果が共有されており、高得点として78.7%が示されています。
Gemini 3 Flash（think）は76.5%、Claude Sonnet 4（think）は74.7%で、推論に特化したトップモデル同士が僅差で競い合っていることを示しています。
さらに、Gemma 4（31B）の「no think」バリアントでは73.5%が示されており、推論モードを無効にすると測定可能なパフォーマンス低下が起きることを示唆しています。
追加のベンチマーク項目として、GPT-5.4（Think）が72.8%で挙げられており、この特定の表では先頭のスコア群より下に位置付けられています。

驚きました（Gemma 4の結果）

https://preview.redd.it/xv1p9zp1tdtg1.png?width=1210&format=png&auto=webp&s=f4cb3b32fd977b3e6d487915de9f985329060342

https://dubesor.de/benchtable

12. Gemma 4 31B（think）をローカルのQ4_K_Mで - 78.7%。

16. Gemini 3 Flash（think） - 76.5%

19. Claude Sonnet 4（think） - 74.7%

22. Claude Sonnet 4.5（no think） - 73.8%

24. Gemma 4 31B（no think）をローカルのQ4_K_Mで - 73.5%。

29. GPT-5.4（Think） - 72.8%

投稿者 /u/Potential-Gold5298
[リンク] [コメント]

関連記事

Black Hat Asia

Black Hat Asia

AI Business

AIエージェントが工事の工程表を最短15分で作成、建設大手も導入に関心

AIエージェントが工事の工程表を最短15分で作成、建設大手も導入に関心

日経XTECH

ファナック、フィジカルAIに本気も人型ロボは静観自前主義から脱却も

ファナック、フィジカルAIに本気も人型ロボは静観自前主義から脱却も

日経XTECH

フィジカルAIは日本の好機、米中と違う勝ち筋3つ FAに起こる地殻変動

フィジカルAIは日本の好機、米中と違う勝ち筋3つ FAに起こる地殻変動

日経XTECH

中国AI企業が「ただ乗り蒸留」か米社が主張、安全保障リスクも

中国AI企業が「ただ乗り蒸留」か米社が主張、安全保障リスクも

日経XTECH

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告