GLM-5.1が稼働開始—Claude Opus 4.5と同等のコーディング能力

Reddit r/LocalLLaMA / 2026/3/27

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • Zhipu AIの旗艦モデル「GLM-5.1」がCoding Planユーザー向けに提供開始され、コーディング能力がClaude Opus 4.5級であるという主張が紹介されています。
  • ベンチマークとしてSWE-bench-Verifiedで77.8点、Terminal Bench 2.0で56.2点を挙げ、オープンソースの最上位水準だとしており、GPT-4oにも近い/上回る可能性が示されています。
  • 200Kの大きなコンテキストウィンドウと最大128K出力、744B(40B活性)パラメータ規模、約28.5Tの事前学習データなどの仕様が記載されています。
  • MCP(Model Context Protocol)をネイティブ対応したことにより、計画→実行→デバッグ→納品といったエージェント的なワークフローや、長いコードベースのリファクタ/デバッグが「実務で可能になる」点が強調されています。
GLM-5.1 が稼働中 — Claude Opus 4.5 と同等のコーディング能力

Zhipu AI の最新フラッグシップモデルである GLM-5.1 が、すべての Coding Plan ユーザーに利用可能になりました。まだご存じない場合は、以下が「知っておく価値がある」理由です:

主要ベンチマーク(2026年3月):

  • SWE-bench-Verified: 77.8 pts — オープンソースモデルの中で最高スコア
  • Terminal Bench 2.0: 56.2 pts — これもオープンソースの SOTA
  • GPT-4o を上回り、コーディング課題では Claude Opus 4.5 に迫る
  • 200K コンテキストウィンドウ、最大 128K 出力
  • 744B パラメータ(40B が有効化)、事前学習データ 28.5T
  • ネイティブ MCP 対応

実際に何ができるのか:

  • 最小限の手取り足取りで行う、自律的なマルチステップのコーディングタスク
  • 長いコンテキストのコードベースのリファクタリングとデバッグ
  • エージェント型ワークフロー:計画 → 実行 → デバッグ → 提供
  • Zhipu AI のプラットフォーム上の Coding Plan(Lite / Pro / Max)で現在提供中

もう GLM-5.1 を試した人はいますか?実運用のコーディングタスクにおいて、Claude 4.6 と比べてどうですか?

投稿者 /u/Which-Jello9157
[link] [comments]
広告