2026年のLLM API料金：主要モデルをすべて1つの表にまとめました

Dev.to / 2026/4/10

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

原文を読む →

共有:

要点

この記事では、2026年におけるLLM API料金の100倍もの大きなばらつきを取り上げています。同一のプロンプト作業負荷であっても、モデルや提供事業者によって請求額が大幅に変わり得ることを示しています。
主要な「フロンティア」「ミッドティア」「バジェット」の各モデルについて、入力・出力トークンあたりの1百万トークン単価を並べて整理し、SWE-benchの性能やキャッシュヒット時の価格といった追加の指標も含めています。
具体的なコスト/パフォーマンスの優位性を特定し、たとえば低価格でSWE-benchのスコアが高い異例の存在としてDeepSeek V4を挙げます。一方で、突発的な障害や、中国向けデータ経路（ルーティング）といったトレードオフの可能性にも注意を促しています。
1日に1万回応答するチャットボットを想定し、トークン価格から月額の運用コスト見積もりを、いくつかの代表的なモデルで幅として提示しています。
さらに、長いコンテキストに対する追加料金、データレジデンシー（データ所在地）プレミアム、直接の提供事業者APIを使うのかゲートウェイを使うのかによる差といった、見えにくい二次的コストにも警告しています。参照として、2026年4月の相互検証済みデータセットを引いています。

LLM API間の価格スプレッドは現在100倍です。Groq Llama 8Bは入力が$0.05/Mです。GPT-5.4 Proは$30/Mです。同じプロンプトで、請求額は大きく異なります。

主要モデルすべての料金を1つの参照表にまとめました。

フロンティア・モデル（最高品質）

モデル	入力/M	出力/M	キャッシュヒット/M	SWE-bench
DeepSeek V4	$0.30	$0.50	$0.03	81%
GPT-5.4	$2.50	$15.00	$0.25	80%
Claude Opus 4.6	$5.00	$25.00	$0.50	80.8%
Claude Sonnet 4.6	$3.00	$15.00	$0.30	79%
Gemini 3.1 Pro	$2.00	$12.00	$0.20	78%

DeepSeek V4が異常値です。 最低価格で最高のSWE-benchスコア。ただし落とし穴があります。時々の障害と、中国向けデータのルーティングです。

ミドルティア（コスパ最良）

モデル	入力/M	出力/M
GPT-5.4 Mini	$0.75	$4.50
Claude Haiku 4.5	$1.00	$5.00
Gemini 2.5 Flash	$0.30	$2.50
Mistral Large 3	$2.00	$6.00

Mistral Large 3は、旗艦モデルとして最安の出力価格です。$6/Mで、GPT/Claudeの$15/Mより60%安い。

バジェット（最安）

モデル	入力/M	出力/M
Groq Llama 8B	$0.05	$0.08
Gemini Flash-Lite	$0.10	$0.40
GPT-5.4 Nano	$0.20	$1.25
Mistral Small 3.1	$0.20	$0.60

1日1万回のチャットボット返信は実際いくらかかるか

モデル	月額コスト
Gemini Flash-Lite	$60
DeepSeek V4	$90
GPT-5.4 Mini	$430
Claude Sonnet 4.6	$1,350

完全な比較は16以上のモデルを対象としており、タスクあたりの内訳、隠れコスト（長いコンテキストに対するサーチャージ、データ保管場所のプレミアム）、およびプロバイダー比較（直接API vs ゲートウェイ）をカバーしています。

LLM料金の完全な比較表

公式プロバイダーページの料金。2026年4月に相互検証。

Black Hat USA

AI Business

Black Hat Asia

AI Business

NVIDIA、フィジカルAI基盤を支配へ通信やデジタルツインにも浸透

日経XTECH

イーロン・マスクも驚いた中国KimiチームのLLM新機軸、3月のAI注目論文