GLM-5.1 is live – coding ability on par with Claude Opus 4.5

Reddit r/LocalLLaMA / 3/27/2026

📰 NewsSignals & Early TrendsTools & Practical UsageModels & Research

Key Points

  • Zhipu AIの旗艦モデル「GLM-5.1」が、Coding Planユーザー向けに提供開始され、コーディング能力がClaude Opus 4.5級とする主張が紹介されています。
  • ベンチマークとしてSWE-bench-Verifiedで77.8点、Terminal Bench 2.0で56.2点を挙げ、オープンソース最上位水準だとしており、GPT-4oにも近い/上回る可能性が示されています。
  • 200Kの大きなコンテキストウィンドウと最大128K出力、744B(40B活性)パラメータ規模、約28.5Tの事前学習データなどの仕様が記載されています。
  • MCP(Model Context Protocol)ネイティブ対応により、計画→実行→デバッグ→納品といったエージェント的ワークフローや、長いコードベースのリファクタ/デバッグが「実務で可能になる」点が強調されています。
GLM-5.1 is live – coding ability on par with Claude Opus 4.5

GLM-5.1, Zhipu AI's latest flagship model, is now available to all Coding Plan users. If you're not familiar with it yet, here's why it's worth knowing about:

Key benchmarks (March 2026):

  • SWE-bench-Verified: 77.8 pts — highest score among open-source models
  • Terminal Bench 2.0: 56.2 pts — also open-source SOTA
  • Beats GPT-4o and approaches Claude Opus 4.5 on coding tasks
  • 200K context window, 128K max output
  • 744B parameters (40B activated), 28.5T pretraining data
  • Native MCP support

What this means in practice:

  • Autonomous multi-step coding tasks with minimal hand-holding
  • Long-context code base refactoring and debugging
  • Agentic workflows: plan → execute → debug → deliver
  • Available now through Coding Plan (Lite / Pro / Max) on Zhipu AI's platform

Anyone tested GLM-5.1 yet? How does it compare to Claude 4.6 for real production coding tasks?

submitted by /u/Which-Jello9157
[link] [comments]
広告