GPT-5.5は消費トークンが減るかもしれないが、常により多くの現金を燃やす

The Register / 2026/5/9

💬 オピニオンIndustry & Market MovesModels & Research

要点

  • この記事は、GPT-5.5が1リクエストあたりのトークン使用量を減らしても、最終的な推論コストは依然として上昇しうると主張しており、その理由はフロンティアモデルの価格設定や計算コストが上がり続けているためです。
  • 「ガソリン代が高騰する」というたとえで、効率改善による小さなメリットが、単価の悪化を背景に現金支出の減少につながらない可能性を説明しています。
  • 要点は、コスト上昇が主にトークン消費量だけではなく、フロンティアモデルの価格トレンドによってもたらされている点にあります。
  • 新しいモデルが“効率が良い”と打ち出していても、ユーザーや企業は支出増を見込んで計画すべきだと示唆しています。

ai と ml

GPT-5.5は燃焼するトークンは少なくなるかもしれないが、常により多くのお金を燃やす

ガソリン代が急騰しているだけではない。フロンティア・モデルの価格設定も同様に上がり続けている

Thomas Claburn Thomas Claburn
Published

最新モデルを使うためのコストが、ますます高くなっています。OpenAIは先月、自社のGPTモデルファミリーのバージョン番号を5.5に引き上げたのに加え、トークン単価も上昇しており、場合によっては前モデルの2倍になっています。

100万トークンあたり、GPT-5.5は入力が5ドル、キャッシュ入力が0.50ドル、出力が30ドルです。前モデルのGPT-5.4は、100万トークンあたり、入力が2.50ドル、キャッシュ入力が0.25ドル、出力が15ドルです。

AI企業側は、コスト増はある程度、トークン処理の効率化によって相殺されており、より少ないトークンでより良い結果が得られると主張しています。

REG AD

「GPT-5.5はGPT-5.4より価格が高いものの、賢さが向上しているだけでなく、トークン効率も大幅に高い」と、同社は導入(ロールアウト)の際にそう述べました

REG AD

しかし、コストは依然として上がっています。効率化によるコスト削減以上に、価格(費用)が押し上げられているのです。OpenRouterが実施した分析によれば、GPT-5.5はプロンプトの長さに応じて、50%以上高いところから、ほぼ2倍まで高くなることがあります。

「当社の分析では、GPT-5.5の実際のコストは49%から92%増加していました」とOpenRouterは述べています。「10,000トークンを超える長いプロンプトでは、より短い完了(completion)によってコストが相殺されました。一方、10,000トークン未満の短いプロンプトでは、完了が短くならないため、コスト増がより大きくなります。」

この幅(49%〜92%)には、モデルのトークン効率改善が織り込まれています。トークン効率の改善は、より長いプロンプトに対してより関係が深いからです。OpenRouterの計測によれば、GPT-5.5は長いプロンプト(10,000トークン以上)に対して、完了トークンを19%から34%少なく生成します。

報告されているOpenAIの2026年の予想損失(140億ドル)が正確だとしたら、執拗に続ける支出のバランスを取るためには、コストはさらに大幅に引き上げる必要があります。しかしこれは、競合のAnthropicも直面している問題であり、2026年に報じられる110億ドルの損失が見込まれています。

AnthropicのClaude Opus 4.7は、改善されたトークナイザーに関する主張の中で、目に見える価格表の変更なしに登場しました。その結果、OpenRouterによれば、より短いプロンプトでは潜在的な節約が見込まれる一方、より長いものでは請求額が増える可能性があります。

「キャッシュの吸収を考慮すると、実際のOpus 4.7の利用を調べたところ、2Kトークンを超えるプロンプトでは実コストが12〜27%増加していました」と、業界述べました。「2K未満の短いプロンプトは例外で、完成(コンプリーション)が大幅に短くなることで、トークナイザーのオーバーヘッドを完全に相殺していました。」

プレミアムモデルでは、さらなる値上げが見込まれます。 ®

返却形式: {"translated": "翻訳されたHTML"}