The Markup

Dev.to / 2026/3/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisIndustry & Market Moves

要点

  • 1トークンあたりのAI推論コストは、前年比で約80%低下したと報じられており、ベンチマークの追跡でも急激な減少が示されている。とはいえ企業全体としては支出が大幅に増えており、モデル効率だけでは説明できない「マークアップ(上乗せ)」のギャップが拡大している。
  • この記事は、企業はモデルを導入するのではなく、エンドツーエンドのシステムを導入していると主張する。そのコスト――ハードウェア、土地、エネルギー、コンプライアンス、法務の間接費、運用――は、主にAIの進歩とは無関係な理由で上昇している。
  • 半導体とデータセンターのサプライチェーンは、関税や規制の枠組みなどの政策によって形づくられている。例として、台湾と比べてTSMCのアリゾナ工場のコストが大幅に高いことや、関税の免除を交渉して取り付ける必要があることが挙げられている。
  • データセンター向けの土地価格は、複数の米国市場で大きく上昇している。ゾーニング/再ゾーニングや、ハイパースケーラーがより大きな区画を取得することが要因となり、AIを展開するための物理的なフットプリント(設置面積)にかかるコストが増えている。
  • GPUの価格と供給は、関税による輸入コストの圧力(引用された増加など)も受けており、安価なモデル計算と高価な導入インフラとの間にある、より広いコストの不一致をさらに押し広げている。

1トークンあたりの推論コストは1年で80%下がった。エンタープライズのAIへの支出は108%増えた。これらの数字の差は、マージン──つまりモデルと現実の世界の間にある、物理的・規制的・構造的なコストであり、AIとは無関係な理由でそれぞれがますます高くなっていく。

今年、言語モデルを動かすためのコストは80%安くなった。平均的な企業は、AIに108%多く支出した。どちらの数字も正しい。それらの間にあるのが、誰も語らない物語だ。

トークンあたりの物語が支配的なのは、それが読みやすく、方向性があるからだ。Epoch AIは、パフォーマンス指標の各ベンチマークにおける、年あたり50倍の中央値の推論コスト低下を追跡している。DeepSeekはより安い学習を実証した。オープンソースのモデルは、コストの下限をさらに圧縮した。トレンドラインは明快だ。出力単位あたりのコストとして測られる知能は、経済史上のどのコモディティよりも速く下がっている。

しかし、企業が展開するのは知能ではない。彼らが展開するのはシステムだ。そしてシステムのコスト──鉄鋼、シリコン、土地、弁護士、キロワット時、コンプライアンスの枠組み、そしてそれらをすべて回し続ける人間──は、逆の方向へ動いている。

The Physical Premium

TSMCはアリゾナに6つの製造拠点(ファブ)を建設している。投資額は650億ドルから1,650億ドルへと増えた。完成すれば、これらのファブは、台湾の同一条件の施設より少なくとも50%高いコストでチップを生産することになる。建設コストだけでも、同じプラントを台湾の台南で建てる場合の4〜5倍だ。

これは非効率性ではない。政策だ。鉄鋼とアルミニウムの関税は50%ある。関税の設計は、国内生産の上乗せを、輸入ペナルティと比べて合理的に見せるようにできている。TSMCは特定の免除を交渉した。建設中は計画した供給能力の2.5倍まで、輸入チップは関税ゼロで搬入可能にし、その後、生産開始後は1.5倍までとする。免除そのものが計算を暴露している──それがなければ、アリゾナの投資は崩壊する。

データセンターの土地が語る内容も同じだ。オハイオ州コロンバスでは、1エーカーあたり3万ドルで売れていた農地が、データセンター用地に用途変更(再ゾーニング)されると、15万ドル超で取引されるようになった。ソルトレイク郡では、価格改定は5万ドルから約40万ドルへ。北バージニア──世界で最も密集したデータセンター市場であるラウドン郡──では、土地は1エーカーあたり400万ドル超だ。データセンター用地に関する全国の加重平均は、前年同期比で23%上昇し、1平方フィートあたり5ドル59セントとなった。さらに、ハイパースケーラーがより大きな用地を取得するため、平均区画面積は2022年以降、144%増えている。

GPUの輸入は、調達地域や分類によって、20〜40%の関税増となる。たとえばNVIDIA H100のクラウドレンタル価格は、たった1か月で10%跳ね上がった。12月から1月の間に、1時間あたり2ドルから2.20ドルへ上昇している。AMDは、関税の前でもメモリコストの圧力だけで、2026年にGPU価格が全体で10%値上がりする見通しだ。最先端プロセスのウェハーは今年、50%高くなると見込まれている。

これらの値上げは、AI投資の物語を支配するトークンあたりコストのトレンドには何も反映されていない。反映されるのは、トークンを生み出す「そのもの」を建てるための総コストだ。

The Iceberg

技術コンサルティング企業Xenossによれば、見えるAIコスト──承認された予算に計上される項目──が、AI支出全体に占める割合はわずか15〜20%にすぎない。残りの80〜85%は、保守、再学習、監視、セキュリティ更新、データエンジニアリング、コンプライアンス、そして、AIシステムを展開後に稼働させ続けるための組織的なオーバーヘッドだ。

保守コストの数字だけでも印象的だ。年次のAIインフラ保守──データが変化してモデルを再学習すること、劣化を監視すること、セキュリティ脆弱性のパッチを当てること、統合を更新すること──は、年間のインフラ総コストの15〜30%に達する。1,000万ドルで構築するシステムは、保守のために毎年150万〜300万ドルかかる。しかも無期限に。

次の層は人材だ。米国におけるAIエンジニアの中央値年収は、2026年に206,000ドルに到達した。これは前年から50,000ドルの増加だ。シニアの機械学習エンジニアは、ベース報酬として213,000ドルを指名する。LLM専門職は、一般的なMLエンジニアに比べて25〜40%の上乗せがある。株式やボーナスを含むシニア実務者の総報酬は、300,000〜500,000ドルの範囲だ。AIエンジニアは、同じレベルの従来のソフトウェアエンジニアより、ベース給が5〜20%高く、株式報酬も10〜20%高い。

水は、どのAI予算の説明資料にも登場しないコストだ。中規模のデータセンターは年間およそ1億1,000万ガロンを消費する──これは1,000世帯分に相当する。より大規模な施設では、1日あたり500万ガロンを消費し得る。米国のデータセンターにおける年間の水消費量は、2028年には2023年の水準に比べて2倍、あるいは4倍になると見込まれている。冷却はデータセンター全エネルギー使用量の30〜40%を占め、さらに多くの冷却システムは水を大量に使う。

エネルギーが全体像を完成させる。データセンターは2024年に世界でおよそ415テラワット時を消費した。2026年の予測は、出所によって500〜1,000テラワット時の範囲にある。アイルランドでは、データセンターが2022年に国内電力の21%を消費し、2026年には32%に達すると予測されている。PJM相互接続地域──米国東部の送電網──では、新たなデータセンターの容量増が、エネルギー市場のコストを93億ドル押し上げ、影響を受けた郡の家庭の電気代に、月あたり約18ドルを追加している。

Zyloの2026 SaaS Management Indexでは、組織がAIネイティブのアプリケーションだけに平均120万ドルを費やしたことが判明した。これは前年から108%の増加だ。これはソフトウェア層だ。ここには、計算(compute)、インフラ、人材、エネルギー、水、土地、またはコンプライアンスは含まれていない。これは、氷山の上に載った氷山の先端にすぎない。

The Inference Flip

2026年でもっとも重大なコストの変化は、AIマネーがどこへ向かうのかという標準的な物語を、裏返すものだ。初めて、推論(inference)の支出が、支配的なAIインフラコストとしての学習を上回った。推論は、2026年の早い時期にAIクラウド・インフラ支出の55%を超えた──375億ドルに相当する。

これは重要だ。推論はAIを使うためのコストであり、それを作るためのコストではない。学習は資本支出であり、大きく、定期的で、計画可能だ。推論は運用費用であり、継続的で、複利的に増え、しかもますます予測不能になる。いま展開されつつあるエージェント型アーキテクチャでは、エージェントが複数ステップのワークフローを推論するため、タスクあたりで言語モデルへの呼び出し回数が10〜20倍になっている。検索拡張生成(RAG)は、クエリのたびに文脈税(context tax)を積み上げる。トークンあたりコストは下がっている。しかし、1タスクあたりのトークン数は爆発的に増えている。

OpenAIの現金消費(キャッシュバーン)は、そのダイナミクスを物語っています。2024年、同社は推論(inference)に34.76億ドルを費やし、その後2025年9月までに86.7億ドルにまで増えました。これは1年未満で2倍以上です。2026年の総キャッシュバーンは250億ドル、2027年は570億ドルになると見込んでいます。トークンあたりの推論コストは下がっています。推論の請求額は上がっています。2月に本誌が取り上げたジェボンズのパラドックスは需要側で働きます。つまり、より安いトークンがより多くの利用を生み出すのです。しかし、マークアップ(上乗せ)は供給側で働きます。どれほど安い1トークンであっても、関税が課されたGPUが必要です。関税付きの鋼材(50%関税)で建てられた建物が必要です。土地は桁違いに再評価(再価格付け)されます。さらに、争点化が進む水で冷却されます。最後に、その電力はそれを消費する同じデータセンターによってコストが押し上げられています。

Barclaysは、消費者向けAI推論だけに限ったチップ関連の設備投資(キャピタル・エクスペンディチャー)が、2026年には1,200億ドルに迫り、2028年には1.1兆ドルを超えると見積もっています。これは推論用のハードウェアのみです。学習(トレーニング)ではありません。エネルギーでもありません。建物でもありません。人材でもありません。コンプライアンスでもありません。

コンプライアンスの崖

2026年8月2日、欧州連合(EU)のAI法(AI Act)が、最も決定的な施行日を迎えます。附属書IIIの高リスクAIシステム要件が拘束力を持つのです。最大罰金は3,500万ユーロ、もしくは世界の年間売上高の7%——いずれか高い方です。これはGDPRの罰則(上限は4%)を上回ります。

売上高が10億ユーロ超の大企業の場合、高リスクAIシステムの初期コンプライアンス投資は800万〜1,500万ドルです。中規模企業では初期で200万〜500万ドル、継続コストは年50万〜200万ドルです。コンプライアンスを管理するソフトウェアであるAIガバナンス・プラットフォーム市場は、2026年に4.92億ドルに達し、2030年には10億ドルを超えると見込まれています。

欧州でAIを展開するすべての企業——つまり、欧州市場の顧客を持つあらゆるグローバル企業——は、このインフラを自社で構築するか、購入しなければなりません。コストは収益を生みません。モデルの性能は向上しません。推論のレイテンシ(遅延)を下げません。これは規制によって義務づけられた純粋な間接費であり、中規模企業にとっては、存在を脅かすほど罰則が重いのです。

この点こそ、1トークンの物語が完全に見落としているパターンです。モデルは安くなります。モデルの周りのものはすべて高くなります。その2つの傾向の差が、マークアップです。

マークアップが明かすもの

マッキンゼーは、今後10年間でAIインフラへの総支出が3兆ドル超に達すると見込んでいます。内訳はこうです。60%が技術——チップやコンピューティング・ハードウェア。25%が電力——発電、送電、冷却、電気設備。15%が建設——土地、資材、用地開発です。技術部分はムーアの法則とアルゴリズム効率の向上の影響を受けます。一方、電力と建設の部分は、コモディティ価格(商品相場)、関税政策、許認可の期限、そして地域の反対運動の影響を受けます。

2026年にAIインフラへ6,650億ドルを投じることを決めている企業は、これを理解しています。Amazonは、今年のフリーキャッシュフローがマイナスとなる見通しで、170億〜280億ドルです。Microsoftのフリーキャッシュフローは、28%減少すると予測されています。Metaは、設備投資(capex)ガイダンスを710億ドルから、1,150億〜1,350億ドルの範囲へと引き上げました。これらは、間違いを犯している企業ではありません。ほかの端で得られる知性(intelligence)が、それを正当化すると信じているために、企業としてマークアップを吸収しているのです。

問題は、誰がそれをほかに吸収するのか、です。デロイトは、米国の企業の40%が、2026年末までにサプライチェーンの少なくとも一部を北米へ移転すると見込んでいます。Appleは4年間で米国への投資に6,000億ドルを投じるとコミットしており、その中には、すでに予定より前倒しでAIサーバーを出荷している、ヒューストンの25万平方フィートの施設も含まれています。ゼネラル・モーターズはAI駆動のサプライチェーン・ツール(それ自体にもマークアップが含まれます)を使って、2027年までに中国調達の部品を段階的に廃止しています。すでに予測モデリングによって、1年で75件の工場停止を回避してきました。

マークアップは、システムのバグではありません。システムそのものです。知性は安くなります。展開する権利——国内の土壌で、国内の素材で、国内外の規制に準拠し、争点化されるエネルギーで動き、争点化される水で冷却され、そしてテクノロジー史上最も高価な人材市場から採用された人員によって支えられる——それはより高くつくようになります。トークンあたりの価格は請求額の15%です。マークアップが残り85%です。

Originally published at The Synthesis — 知性の移行を内部から観察する。