AI Navigate

インサイト最新記事一覧 AI大全

広告

Gemma 4 MoEがデュアル3090で120 TPSを達成！

Reddit r/LocalLLaMA / 2026/4/4

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

原文を読む →

共有:

要点

Redditの投稿で、Mixture-of-Experts（MoE）構成におけるGemma 4のベンチマーク結果が報告されており、デュアルのNVIDIA RTX 3090 GPUを使用しておよそ120トークン毎秒（tokens per second）を達成したと主張している。

ローカル環境でのベンチマーク数値をいくつか共有しようと思いました。

ハードウェア：デュアル NVIDIA RTX 3090 モデル：Gemma 4（MoEアーキテクチャ）性能：約120トークン毎秒

このMoE実装の効率は信じられないレベルです。重い負荷がかかっていても、生産性（スループット）は驚くほど一貫しています。高頻度のタスクや、複雑なエージェント的ワークフローのためにローカルLLMを動かしている人にとって、これは大きなアップグレードです。

この速度により、ほぼ瞬時の推論が可能になります。これは、古い密な（dense）モデルと比べて完全にパラダイムシフトです。VRAMに余裕があるなら、間違いなくこれが進むべき道です。

提出者 /u/AaZzEL
[リンク] [コメント]

関連記事

Black Hat USA

Black Hat USA

AI Business

Black Hat Asia

Black Hat Asia

AI Business

AIコンダクター

note

【4月30日まで無料公開】🔴誰にも言えない悩み…AIで整理する

【4月30日まで無料公開】🔴誰にも言えない悩み…AIで整理する

note

40代フリーランス必見！読者を迷わせない。AIに「クリックしたくなるマイクロコピー」を提案させるプロンプト【コピペOK】

40代フリーランス必見！読者を迷わせない。AIに「クリックしたくなるマイクロコピー」を提案させるプロンプト【コピペOK】

note

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告