AI Navigate

GLM 5の実力を今さらながら実感した

Reddit r/LocalLLaMA / 2026/3/18

💬 オピニオンSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 著者は、最近120億トークン以上を処理している Claude Code のヘビー ユーザーで、Zen プランの OpenCode と GLM 5 を試し、GLM 5 を全体的に魅力的だと感じた。
  • 簡単なダッシュボード在庫管理タスクでは、GLM 5 は Claude Code とほぼ同等の性能だったが、opus 4.6 を搭載した Claude Code がそのタスクをリードした。
  • より難しいタスクとして WebSocket を使うリアルタイムのチャットアプリケーションが含まれる場合、GLM 5 は Claude Code を上回り、Claude Code はストリーミングに苦戦してメッセージを表示するにはページの更新が必要だった。
  • レビュアーは GLM が自分の基準で高得点を取り、提案されたフィードバックを適用しても依然として優れていると評価しており、修正点について Claude と GLM の両方に詳細なフィードバックを送るよう促した。
  • 他の人にも難易度の高いコーディング課題を提案してモデル間の真のギャップを明らかにし、GLM 5 が本当にそこまで優れているのかを検証するよう呼びかけて結論づけた。

これは信じられない話だ。過去数か月で120億トークン以上を使用し、ローカルでのコーディングを一度も試したことがないヘビーな Claude Code ユーザーとして、ついに Zen プランの OpenCode と GLM 5 を試すことに決めた。

最初は Kimi K2.5 を試したが、全く良くなかった。

GLM 5 と Claude Code の同じプロンプトを比較して、1~2つのプロンプトでどこまで行けるかをテストしてみた。

最初の課題は、単純なダッシュボード在庫追跡ツールだった。ほぼ互角だったが、opus 4.6 を搭載した Claude Code がやや先行した。

次に、より難しいタスクを実行した。WebSocket を使ったリアルタイムチャットアプリケーション。

驚いたことに、GLM が優位に出た。Claude Code は一発目の試行ですらストリーミングが機能していない。メッセージを見るにはページをリフレッシュする必要がある。

私の基準では GLM の得点がはるかに高い。

Claude と GLM に対し、修正すべき点を詳しくフィードバックしてください。

変更後も GLM の方がむしろ上回っている。

ここで私は幻覚を見ているのだろうか? どんなタスクでも Claude Code より GLM の方が優れているなんて、信じられない。

ここに、これら二つのモデル間の実際のギャップを示すような難しいコーディング課題を持つ人はいますか、それとも GLM 5 はただそれだけ優れているのでしょうか。

投稿者 /u/CrimsonShikabane
[リンク] [コメント]