トークン・レジャー・ダイジェスト – 2026-05-20

Dev.to / 2026/5/20

📰 ニュースSignals & Early TrendsTools & Practical UsageIndustry & Market Moves

要点

  • GoogleのGemini Flash latest(~google/gemini-flash-latest)で、プロンプト単価が$0.50/1Mから$1.50/1M、完了単価が$3.00/1Mから$9.00/1Mに上昇し、特に高頻度の推論でコスト増が大きくなります。
  • Z.aiのGLM 5.1(z-ai/glm-5.1)はプロンプト単価・完了単価ともに$0に低下し、ゼロトークンコストでの利用が可能になりました。
  • Qwen系の複数モデル(Qwen3.6 35B A3B、Qwen3.5-35B-A3B)では価格変動がわずかで、実質的な影響は小さいため継続監視で十分です。
  • 新たにGoogleのGemini 3.5 Flash(google/gemini-3.5-flash)が追加され、プロンプト$1.50/1M・完了$9.00/1M、コンテキストは1,048,576トークンと長文用途向けの選択肢として比較検討が促されています。

Token Ledger Digest – 2026-05-20

変更の主なポイント—最大のコスト影響

  • Google Gemini Flash 最新 (~google/gemini-flash-latest)
    • プロンプト価格が $0.50/1M から $1.50/1M に上昇(+$1.00/1M)。
    • 完了価格が $3.00/1M から $9.00/1M に上昇(+$6.00/1M)。
    • 対象者: このモデルで高ボリュームの推論を実行しているチームは、1百万トークンあたりのコストが $7.00 増加します。代替案やプロンプト/完了の最適化を検討してください。

その他の価格変更

  • Z.ai GLM 5.1 (z-ai/glm-5.1)

    • プロンプト価格が $0.98/1M から $0.00/1M に下落。
    • 完了価格が $3.08/1M から $0.00/1M に下落。
    • 対象者: これでトークンコストをゼロにしてこのモデルを実行できます。コストに敏感なプロトタイプやバッチ処理に最適です。
  • Qwen: Qwen3.6 35B A3B (qwen/qwen3.6-35b-a3b)

    • プロンプト価格が $0.15/1M から $0.149/1M にわずかに下落(‑$0.001/1M)。
    • 完了価格は $1.00/1M のままで変更なし。
    • 対象者: 影響はほとんどありません。今後の変動に注意してください。
  • Qwen: Qwen3.5‑35B‑A3B (qwen/qwen3.5-35b-a3b)

    • プロンプト価格が $0.14/1M から $0.139/1M に下落(‑$0.001/1M)。
    • 完了価格は $1.00/1M のままで変更なし。
    • 対象者: 影響は最小限です。対応は不要です。

新しいモデルを追加

  • Google Gemini 3.5 Flash (google/gemini-3.5-flash)
    • プロンプト価格: $1.50/1M。
    • 完了価格: $9.00/1M。
    • コンテキストウィンドウ: 1,048,576 トークン。
    • 対象者: 非常に長いコンテキストを必要とする開発者向けです。他の長文コンテキストの選択肢と価格を比較してください。

まとめ

追跡しているモデル数: 357。その他の重要な変更はありません。

もともとは The Token Ledger で公開されました。毎日のダイジェストを購読してください。