AI Navigate

インサイト最新記事一覧 AI大全

GLM-5.1が稼働開始—Claude Opus 4.5と同等のコーディング能力

Reddit r/LocalLLaMA / 2026/3/27

📰 ニュースSignals & Early TrendsTools & Practical UsageModels & Research

原文を読む →

共有:

要点

Zhipu AIの旗艦モデル「GLM-5.1」がCoding Planユーザー向けに提供開始され、コーディング能力がClaude Opus 4.5級であるという主張が紹介されています。
ベンチマークとしてSWE-bench-Verifiedで77.8点、Terminal Bench 2.0で56.2点を挙げ、オープンソースの最上位水準だとしており、GPT-4oにも近い/上回る可能性が示されています。
200Kの大きなコンテキストウィンドウと最大128K出力、744B（40B活性）パラメータ規模、約28.5Tの事前学習データなどの仕様が記載されています。
MCP（Model Context Protocol）をネイティブ対応したことにより、計画→実行→デバッグ→納品といったエージェント的なワークフローや、長いコードベースのリファクタ/デバッグが「実務で可能になる」点が強調されています。

GLM-5.1 が稼働中 — Claude Opus 4.5 と同等のコーディング能力

Zhipu AI の最新フラッグシップモデルである GLM-5.1 が、すべての Coding Plan ユーザーに利用可能になりました。まだご存じない場合は、以下が「知っておく価値がある」理由です：

主要ベンチマーク（2026年3月）：

SWE-bench-Verified: 77.8 pts — オープンソースモデルの中で最高スコア
Terminal Bench 2.0: 56.2 pts — これもオープンソースの SOTA
GPT-4o を上回り、コーディング課題では Claude Opus 4.5 に迫る
200K コンテキストウィンドウ、最大 128K 出力
744B パラメータ（40B が有効化）、事前学習データ 28.5T
ネイティブ MCP 対応

実際に何ができるのか：

最小限の手取り足取りで行う、自律的なマルチステップのコーディングタスク
長いコンテキストのコードベースのリファクタリングとデバッグ
エージェント型ワークフロー：計画 → 実行 → デバッグ → 提供
Zhipu AI のプラットフォーム上の Coding Plan（Lite / Pro / Max）で現在提供中

もう GLM-5.1 を試した人はいますか？実運用のコーディングタスクにおいて、Claude 4.6 と比べてどうですか？

投稿者 /u/Which-Jello9157
[link] [comments]

広告

関連記事

[Boost]

[Boost]

Dev.to

実運用アプリにおけるLLMコンテキストの管理

実運用アプリにおけるLLMコンテキストの管理

Dev.to

39体のエージェント・システムをライブ監査してみた。成熟度スコアカードが明らかにしたこと

39体のエージェント・システムをライブ監査してみた。成熟度スコアカードが明らかにしたこと

Dev.to

OpenAIがSoraを終了 — 10分でできる移行ガイド（無料API）

OpenAIがSoraを終了 — 10分でできる移行ガイド（無料API）

Dev.to

AIボイスエージェントをWebSocketからWebRTCに切り替えた——何が壊れて、何を学んだか

AIボイスエージェントをWebSocketからWebRTCに切り替えた——何が壊れて、何を学んだか

Dev.to

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。