API 価格戦争と単価動向:モデル選定とコストロックインの読み方

AI Navigate Original / 2026/4/27

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage
共有:

要点

  • API 価格は 3 年で 1/10-1/30、双方に追い風
  • モデルカスケード:Light8 割で frontier 単体比 1/5-1/10
  • ロックイン対策:抽象化・多モデル評価・プロンプトキャッシュ
  • セルフホスト損益分岐はボリューム次第、運用コスト込み

AI の API 料金は、この 3 年で劇的に動きました。2023 年に登場した GPT-4 は 入力 $30・出力 $60(100 万トークンあたり)という高額でしたが、2026 年現在は同等以上の性能でもはるかに安く使えます。ただし「ひたすら下がり続ける」という単純な話ではありません。軽量モデルや新興プレイヤーが床を押し下げる一方、最上位モデルは 2026 年に値上げに転じた——この二層構造を読めるかどうかが、コスト設計の分かれ目です。本記事は、価格の現在地・動く理由・賢い使い分け・特定ベンダーに縛られないための備えを、初めての方にも分かるよう整理します。

$ / 1M 2023 → 2026 天井(最上位) 2026 反転↑ 最安期 床(軽量・新興)下がり続ける

FIG.1 「床」は下がり続け、「天井」は 2026 年に上向いた——平均ではなく二層で見る

013 年で何が起きたか

2023 年 3 月の GPT-4 は、入力 100 万トークンあたり $30、出力 $60。当時は 100 万トークン(日本語でおよそ 50〜70 万字相当)を処理するだけで数千円かかり、使える用途は法務分析や金融モデリングなど「高くても割に合う」領域に限られていました。

2026 年現在は様変わりしています。日常的な要約・分類・翻訳なら 入力 $0.1〜$0.5 程度の軽量モデルで十分にこなせ、用途によっては 1/30〜1/100 のコストです。背景にあるのは、半導体の効率向上(新世代 GPU・専用チップ)、推論を軽くする技術(量子化・蒸留・Mixture of Experts)、そして競合の激化。安く速く動く層が一気に広がりました。

安くなったのは 「普段づかいの層」。最先端の最上位モデルは、別の力学で動いています。

02主要モデルの料金(2026 年・概算)

下表は 2026 年中頃時点の公開価格の目安です。料金は頻繁に改定されるため、実際に採用するときは必ず各社の公式ページで最新値を確認してください。出力は入力の数倍に設定されているのが各社共通の特徴で、出力をいかに短くするかがコストに直結します。

モデル入力 ($/1M)出力 ($/1M)位置づけ
GPT-5.5$5$30最上位(2026-04 に値上げ)
GPT-5.4$2.50$15高性能・前世代旗艦
Claude Opus 4.8$5$25最上位(推論・長文)
Claude Sonnet 4.6$3$15中位・バランス
Claude Haiku 4.5$1$5軽量・高速
Gemini 3 Pro$2長文・マルチモーダル
Mistral Large 3$0.50低価格な欧州製旗艦
DeepSeek(V4 世代)$0.1 台$0.3 前後超低価格・中国製

「—」は本記事執筆時点で確実に裏取りできなかった値で、空欄のままにしています(不確かな数字は載せない方針)。プロンプトキャッシュやバッチ処理を併用すれば、ここからさらに 50〜90% 下がる場合があります(後述)。

032026 年の重要な転換——最上位は値上がりした

注目すべきは、2026 年に最先端モデルの値段が下げ止まり、むしろ上がったことです。OpenAI は 2026 年 4 月 23 日に GPT-5.5 を出した際、入力を $2.50 → $5、出力を $15 → $30 へと倍に引き上げました。Anthropic も最上位 Opus の通常料金($5 / $25)は据え置きつつ、より速い「Fast Mode」を $10 / $50 という高単価で別建てにしています。

理由はシンプルで、最先端モデルは作るのも動かすのも高いからです。学習コストの巨大化、長文コンテキスト(数百万トークン)やマルチモーダル(音声・動画)の処理負荷、そして需要増による計算資源の逼迫。フロンティアの体験を求める人には、相応の対価が請求される時代に入りました。

続きを読むには無料登録が必要です

アカウントを作成すると、オリジナル記事の全文をお読みいただけます。