AI Navigate

z.ai、エージェント向けのより高速・低価格な GLM-5-Turbo モデルを発表 — ただしオープンソースではない

VentureBeat / 2026/3/17

📰 ニュースTools & Practical UsageIndustry & Market MovesModels & Research

要点

  • z.ai は、エージェント主導のワークフローや OpenClaw風のタスク(ツールの使用や長鎖の自動化など)に設計された、GLM-5 の高速で独自仕様の派生モデル GLM-5-Turbo を発表しました。
  • このモデルはオープンソースではなく、OpenRouter を通じた API 経由でアクセス可能で、202.8K トークンのコンテキストウィンドウ、131.1K トークンの最大出力、入力トークン1百万あたり0.96ドル、出力トークン1百万あたり3.20ドルの価格設定です。
  • 1百万トークンの総費用は4.16ドルと記載されており、提供された価格比較に基づくと先代の GLM-5 より約0.04ドル安い、とのことです。
  • リリースは AI エージェントと自動化パイプラインを構築する開発者を対象としており、現在は OpenRouter を通じて提供されています。

中国のAIスタートアップ Z.ai は、強力なオープンソース GLM ファミリーの大規模言語モデル(LLMs)で知られており、GLM-5-Turboを導入した新しい、独自のバリアントであるオープンソース GLM-5 モデルを、エージェント駆動のワークフローを対象としています。同社はこれをツールの使用、長い連鎖の実行、継続的な自動化といった OpenClaw風のタスク に合わせて高速化したモデルとして位置づけています。

現在、Z.ai のアプリケーション・プログラミング・インターフェース(API)を介して、サードパーティ提供者の OpenRouter で入手可能で、約 202.8K トークンのコンテキストウィンドウ、131.1K の最大出力、入力トークン1Mあたり0.96ドル、出力トークン1Mあたり3.20ドルの価格が掲示されています。これにより、私たちの計算によると、総入力および出力コスト(1M トークンあたり)で先代より約0.04ドル安くなる、ことがわかっています。

モデル

入力

出力

総コスト

出典

Grok 4.1 Fast

$0.20

$0.50

$0.70

xAI

Gemini 3 Flash

$0.50

$3.00

$3.50

Google

Kimi-K2.5

$0.60

$3.00

$3.60

Moonshot

GLM-5-Turbo

$0.96

$3.20

$4.16

OpenRouter

GLM-5

$1.00

$3.20

$4.20

Z.ai

Claude Haiku 4.5

$1.00

$5.00

$6.00

Anthropic

Qwen3-Max

$1.20

$6.00

$7.20

Alibaba Cloud

Gemini 3 Pro

$2.00

$12.00

$14.00

Google

GPT-5.2

$1.75

$14.00

$15.75

OpenAI

GPT-5.4

$2.50

$15.00

$17.50

OpenAI

Claude Sonnet 4.5

$3.00

$15.00

$18.00

Anthropic

Claude Opus 4.6

$5.00

$25.00

$30.00

Anthropic

GPT-5.4 Pro

$30.00

$180.00

$210.00

OpenAI

第二に、Z.ai は GLM Coding のサブスクリプション製品にもこのモデルを追加します。これはパッケージ化されたコーディング・アシスタント・サービスです。そのサービスには3つの階層があります。Lite は1四半期あたり27ドル、Pro は81ドル、Max は216ドル。

Z.ai の3月15日の導入ノートによると、Pro の加入者は3月に GLM-5-Turbo を入手し、Lite の加入者は3月に基本の GLM-5 を入手して4月まで GLM-5-Turbo を待つ必要があります。同社はまた、企業向けの早期アクセス申請を Google フォーム経由で受け付けており、容量次第でそのスケジュールより前にアクセスできる可能性があることを示唆しています。

z.ai は GLM-5-Turbo を「高速推論」および「長い実行チェーンを含む実世界のエージェントワークフローに深く最適化」された設計と説明しており、複雑な指示の分解、ツールの使用、スケジュール実行と継続的実行、長時間のタスク全体での安定性の改善を挙げています。

このリリースは開発者に OpenClaw スタイルの自律AIエージェントを構築する新しい選択肢を提供し、モデルベンダーが企業の需要がどこへ向かうと見ているかの指標にもなります。チャットインターフェースから離れ、複数ステップの作業を信頼性高く実行できるシステムへと向かう方向性です。

現在、競争の多くもそこへ移動しています。特に、開発者と社内アシスタント、ワークフロー・オーケストレーター、コーディングエージェントを構築する企業チームを獲得しようとするベンダーの間で。

実行のために設計された、会話だけではない

Z.ai の資料は GLM-5-Turbo を、静的なプロンプト応答の使用ではなく、実運用に近いエージェント挙動のモデルとして位置づけています。

提案の中心は、実用的なタスクフローにおける信頼性です。より良いコマンドの追従、ツール呼び出しの強化、スケジュール済みおよび継続的なタスクの処理の改善、長い論理チェーン全体での高速な実行。そうした位置づけは、質問に答える以上のことを行うエージェント市場にモデルを明確に位置づけます。

情報を収集し、ツールを呼び出し、指示を分解し、複雑なタスクの連続を監督者の監視を受けずに進められるシステムを対象としています。

GLM-5 の直接的な後継というより、GLM-5-Turbo は速度・ツール使用・長鎖エージェントの安定性に焦点を当てた、より実行志向のバリアントのようです。基盤の GLM-5 は引き続き Z.ai の広範なオープンソース旗艦です。

GLM-5-Turbo は、情報検索・収集、オフィス・日常タスク、データ分析、開発と運用、そして自動化といった OpenClaw シナリオで特に競争力があるようです。これらは会社提供の資料であり、独立した検証ではありませんが、意図された製品の位置づけを明確にしています。

背景: z.ai と GLM-5 が Turbo の舞台を整える

2019年に北京で清華大学のスピンオフとして設立された Z.ai(旧称 Zhipu AI)は、中国で最もよく知られたファウンデーションモデル企業の1つです。同社は北京に本社を置き続け、CEO は Zhang Peng 氏が率いています。

Z.ai は 2026年1月8日に香港証券取引所に上場し、株価は HK$116.20、初値は HK$120、時価総額は HK$528.3億とされています。これにより、中国最大の独立系大規模言語モデル開発企業となっています。

2025年9月30日時点で、同社のモデルは 12,000 件を超える企業顧客、8,000万を超えるエンドユーザーデバイス、世界中で 4,500 万人を超える開発者に利用されていたと報告されています。

Z.ai’s last major release, GLM-5 は、2026年2月にデビューし、同社が現在 GLM-5-Turbo で試みていることの有用な文脈を提供します。

GLM-5 は MIT ライセンスを持つオープンソースの旗艦モデルで、AA-Omniscience Index で過去最低の幻覚スコアを記録し、プロンプトや出典資料をそのまま使えるネイティブの“Agent Mode”を初公開しました。

この以前のリリースは、同社にとっても大きな技術的飛躍として位置づけられていました。GLM-5 は7440億パラメータに拡張され、1トークンあたり40億の活性化を持つ混成アーキテクチャ、28.5兆のプレトレーニング・トークンを使用し、訓練のボトルネックを減らしてより複雑なエージェント的挙動をサポートする新しい非同期強化学習インフラ「slime」に依存していました。

そのような観点から、GLM-5-Turbo は GLM-5 の代替というより、長文脈とエージェント志向の特徴を保持しつつ、現実世界のエージェント連鎖でのスピード、安定性、実行を重視する商用の派生バージョンのように見えます。

開発者向け機能とモデルのパッケージ化

技術面では、Z.ai は GLM-5 ファミリーを、長文脈処理、ツール、推論サポート、構造化された統合といった、開発者が本格的なエージェント向けモデルに期待する機能を備えたGLM-5 ファミリーをパッケージ化しています。

OpenRouter の GLM-5-Turbo ページは、ツールのサポート、ツールの選択、応答形式のサポートを掲載するとともに、平均スループットやレイテンシを含むライブ性能データを表示します。

OpenRouter のプロバイダーテレメトリは、GLM-5 と GLM-5-Turbo のデプロイメントレベルでの比較を有用に追加しますが、データは完全に同等ではありません。GLM-5 は複数のプロバイダで現れますが、GLM-5-Turbo は Z.ai 経由のみ表示されています。

スループットについて、GLM-5-Turbo は OpenRouter で 48 トークン/秒の平均を記録しており、スクリーンショットに示されている最速の GLM-5 エンドポイント(Fireworks が 70 tok/s、Friendli が 58 tok/s)よりは遅い一方、Together の 40 tok/s よりは上です。

生の最初のトークン遅延では、利用可能なデータでは GLM-5-Turbo が遅く、Friendli の GLM-5 エンドポイントが 0.41 秒、Parasail が 1.00 秒、DeepInfra が 1.08 秒であるのに対して 2.92 秒を記録しています。

しかしエンドツーエンドの完了時間では改善され、GLM-5-Turbo は 8.16 秒と表示され、Fireworks の 9.34 秒から DeepInfra の 11.23 秒までの GLM-5 エンドポイントより速いです。

最も顕著な運用上の利点はツールの信頼性です。GLM-5-Turbo はツール呼び出しエラー率が 0.67% で、表示されている GLM-5 の提供者群で示されるエラー率(2.33% 〜 6.41%)よりも実質的に低いです。

企業チームにとって、それは現在の OpenRouter ルーティングで初期の応答性において必ずしも優れているモデルでない可能性を示唆しますが、完了の安定性とツールの故障を低減する点が、最初のトークンの最速さよりも重要になる長時間のエージェント実行には依然として適している可能性があります。

ベンチマーキングと価格

z.ai によって公開された ZClawBench のレーダーチャートは、情報検索と収集、オフィス・日常業務、データ分析、開発と運用、そして自動化といった OpenClaw のシナリオにおいて GLM-5-Turbo が特に競争力を持つことを示しています。

これらは企業が提供したベンチマークのビジュアルで、独立した検証ではありませんが、Z.ai が 2 つのモデルをどのように理解してほしいかを説明するのに役立ちます。GLM-5 はより広範なコーディングとオープンなフラッグシップとして、Turbo はよりターゲットを絞ったエージェント実行バリアントとして。

よりニュアンスのあるライセンス信号

重要な注意点の1つはライセンスです。Z.ai は GLM-5-Turbo が現在クローズソースであると述べていますが、同時にこのモデルの機能と知見は次のオープンソースモデルリリースに組み込まれるとも述べています。これは重要な区別です。同社が GLM-5-Turbo 自体をオープンソースにすることを明確に約束しているわけではありません。

代わりに、このリリースからの教訓、技術、改善点が将来のオープンモデルに情報を提供することを意味しています。これにより、オープン性からの単純な分離よりも、ローンチはよりニュアンスのあるものになります。

Z.ai のこれまでの GLM 戦略は、オープンリリースとオープンウェイトの配布に大きく傾いており、開発者の間での認知度の向上に役立ちました。

中国の AI 市場はオープンソースからの再バランスへ向かっている可能性

GLM-5-Turbo のライセンス姿勢は、中国市場全体の文脈にも位置づけられ、単なる製品アップデート以上にこのローンチを際立たせています。

近頃数週間の報道では、アリババの Qwen ユニットをめぐる報道が、中国の主要なAI研究所がオープンリリースと商業的圧力をどうバランスさせるかについて新たな疑問を投げかけています。

今月初め、Qwen部門長の林俊陽が辞任し、2026年には Qwen の上級幹部を去った3人目となりました。とはいえ、アリババの Qwen ファミリーは、2023年以降に公開されたオープンソースモデルが400以上、ダウンロードが10億を超えるなど、世界で最も生産的なオープンモデルの取り組みのひとつであり続けています。

ロイターは3月16日に、アリババのCEOエディ・ウーが直接統括することになると報じられた新設のAI重視ビジネスグループを統括する予定であると報じられました。これは、中国でのオープンモデル提供を巡る戦略・収益性・過酷な価格競争に対する監視の中でのことです。

これらの動向を過大に評価することなくとも、それらはセクター全体にかかるより広い問いを浮かび上がらせます。すなわち、フロンティアAI の経済学が、歴史的にオープン志向だった中国の研究機関さえも、よりセグメント化された戦略へと押しやるのではないか、という問いです。

それは中国の研究所がオープンソースを放棄するという意味ではありません。しかし、この傾向は無視しにくくなっています。オープンモデルは普及、開発者の好意、エコシステムの到達範囲を促進します。一方で、企業向けエージェント、コーディングワークフロー、その他商業的に魅力的なユースケースを狙った特定の高価値バリアントは、まずは独自製品として登場する可能性が高まるかもしれません。

その意味で、GLM-5-Turbo は中国の AI 市場で起こりうるより大きな転換に適合しており、米国で OpenAI、Anthropic、Google が用いているプレイブック—配布としてのオープン性、ビジネスとしての独自システム—にますます類似しています。

その視点から見ると、GLM-5-Turbo は単なる速度重視の製品アップデート以上のものに見えます。中国の AI セクターの一部が、すでに米国で一般的になっている同じハイブリッドモデル—配布としてのオープン性、ビジネスとしての独自システム—へ向かって動いているという別の兆候かもしれません。

それは中国の研究機関からのオープンソースAIの終わりを意味するものではありませんが、彼らの最も戦略的に重要なエージェント中心の提供が、まずは閉ざされたアクセスの背後に現れ、後にその基盤となる進展のいくつかがオープン公開へと波及する可能性を意味するかもしれません。

エージェント・プラットフォームを評価する開発者にとって、それは GLM-5-Turbo が製品のローンチであると同時に有用な信号でもあります。Z.ai は依然としてオープンモデルの言語を用いています。しかしこのリリースでは、同社の最も商業的に関連性の高い作業のいくつかが、企業グレードのエージェント・システム用の独自インフラストラクチャとして先に登場する可能性があることを示しています。