いまのOpus 4.6があまりにも酷い(“脳を取り除かれた”みたいだ)と感じる。手元の5070 Tiで行った『carwashテスト』では、Gemma 4 31B UD IQ3 XXSでもそれを上回りました。

Reddit r/LocalLLaMA / 2026/4/9

💬 オピニオンSignals & Early TrendsModels & Research

要点

  • Redditのユーザーが、Opus 4.6のパフォーマンスが良くないと主張し、非公式なテストでは他のモデルに比べて「lobotomized(脳を取り除かれたような)」だと表現しています。
  • ユーザーは、個人の環境で5070 Tiを使って「carwashテスト」を実施したところ、Gemma 4 31B(UD IQ3 XXS)がOpus 4.6を上回ったと報告しています。
  • この投稿は、モデル開発者が共有した公式な評価方法や厳密な手順ではなく、主観的でユーザー主導のベンチマークに基づいています。