AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

nvidia/Gemma-4-26B-A4B-NVFP4

Reddit r/LocalLLaMA / 2026/5/1

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

原文を読む →

共有:

要点

ユーザーは、NVIDIAのGemma 4 26Bの派生モデル（nvidia/Gemma-4-26B-A4B-NVFP4）がRTX 5090上で動作し、GPUメモリの割り当てを約80%にすることで約50kのコンテキスト長が得られたと報告しています。
NVFP4量子化モデルのサイズは約18.8GBとされており、フル精度版よりもVRAM要件を下げられることを示唆しています。
ベンチマークでは、複数のテストでフル精度と比べて同等〜わずかに良い結果が見られ、たとえばAIME 2025ではNVFP4が90.00%（フル精度88.95%）でした。
一方で、GPQA Diamondのようにわずかに低下する指標（NVFP4 79.90% vs 80.30%）もあるものの、IFEvalのようにほぼ同水準の例（96.40% vs 96.60%）もあります。

nvidia/Gemma-4-26B-A4B-NVFP4

5090で動作することを確認しました。80%の割り当て（32GBのうち）で、約50kのコンテキストでした。
18.8GBです

ベンチマーク	ベースライン（フル精度）	NVFP4
GPQA Diamond	80.30%	79.90%
AIME 2025	88.95%	90.00%
MMLU Pro	85.00%	84.80%
LiveCodeBench (pass@1)	80.50%	79.80%
IFBench	77.77%	78.1%
IFEval	96.60%	96.40%

submitted by /u/reto-wyss
[リンク] [コメント]

関連記事

Black Hat USA

Black Hat USA

AI Business

AIの次に来る技術、投資データで浮き彫りにランキング上位を徹底解説

AIの次に来る技術、投資データで浮き彫りにランキング上位を徹底解説

日経XTECH

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

自律的なコーディングエージェントが失敗し続ける理由――そして本当に効く対策

Dev.to

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣

ChatGPTの「画像生成」、どう進化？　開発者に聞く　“文字化け解消”の秘訣

ITmedia AI+

テキストから画像は簡単だが、LLMを連携して自律的に生成・批評・反復するのはルーティング地獄——AgentSwarmsが画像生成プレイグラウンドに対応

テキストから画像は簡単だが、LLMを連携して自律的に生成・批評・反復するのはルーティング地獄——AgentSwarmsが画像生成プレイグラウンドに対応

Reddit r/artificial

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告