これは信じられない話だ。過去数か月で120億トークン以上を使用し、ローカルでのコーディングを一度も試したことがないヘビーな Claude Code ユーザーとして、ついに Zen プランの OpenCode と GLM 5 を試すことに決めた。
最初は Kimi K2.5 を試したが、全く良くなかった。
GLM 5 と Claude Code の同じプロンプトを比較して、1~2つのプロンプトでどこまで行けるかをテストしてみた。
最初の課題は、単純なダッシュボード在庫追跡ツールだった。ほぼ互角だったが、opus 4.6 を搭載した Claude Code がやや先行した。
次に、より難しいタスクを実行した。WebSocket を使ったリアルタイムチャットアプリケーション。
驚いたことに、GLM が優位に出た。Claude Code は一発目の試行ですらストリーミングが機能していない。メッセージを見るにはページをリフレッシュする必要がある。
私の基準では GLM の得点がはるかに高い。
Claude と GLM に対し、修正すべき点を詳しくフィードバックしてください。
変更後も GLM の方がむしろ上回っている。
ここで私は幻覚を見ているのだろうか? どんなタスクでも Claude Code より GLM の方が優れているなんて、信じられない。
ここに、これら二つのモデル間の実際のギャップを示すような難しいコーディング課題を持つ人はいますか、それとも GLM 5 はただそれだけ優れているのでしょうか。
[リンク] [コメント]

