v0.20.4-rc2: gemma4: Disable FA on older GPUs where it doesn't work (#15403)

Ollama Releases / 4/8/2026

📰 NewsDeveloper Stack & InfrastructureModels & Research

Key Points

  • Ollamaのリリース候補版v0.20.4-rc2において、gemma4で動作しない(対応しない)古いGPU環境ではFA(機能/機構)を無効化する対応が入った。
  • 古いGPUでの非対応・不具合を避けることで、モデル実行時の安定性と互換性を高める狙いがある。
  • 対象はgemma4の実行パスで、GPU世代差による挙動の差を吸収するように設定/制御が調整された。
ollama / ollama Public

v0.20.4-rc2

@dhiltgen dhiltgen tagged this 07 Apr 21:54
CUDA older than 7.5 lack the support to enable flash attention for the model.
Assets 2
Loading

Uh oh!

There was an error while loading. Please reload this page.