いまの AI 競争は、モデルの賢さだけでは決まりません。「どれだけの計算資源(チップ・電力・冷却)を、どれだけ安く確保できるか」が勝敗を分けます。本稿は、AI を動かす半導体の地図を初学者向けに整理します。NVIDIA の GPU、Google や Amazon の自社チップ、中国勢の事情、そして供給のボトルネックまで、2026 年時点の実情を順に見ていきます。
FIG.1 AI データセンターは「チップ → 電力 → 冷却 → 立地」が連なってはじめて動く
つまり AI の話なのに、出てくるのは半導体・発電・配管・不動産。賢いモデルを作っても、それを載せるチップが手に入らなければ動きません。だからこそ各社は数千億〜数兆円を投じてチップと電力を奪い合っています。
01主役は NVIDIA の GPU
AI の学習・推論で圧倒的に使われているのが NVIDIA の GPU です。世代は「Hopper → Blackwell → Rubin」と進んできました。
- Hopper(H100 / H200):2022〜2024 年に普及した世代。いまも現役で、多くの AI サービスを支えています。
- Blackwell(B200 / GB200):2024 年末から量産。GPU と CPU を組み合わせた「GB200 NVL72」というラック単位の製品が主力になりました。1 ラックがほぼ 1 つのスーパーコンピュータです。
- Rubin(Vera Rubin):次世代。2026 年 1 月の CES で「Vera Rubin NVL72」として発表され、フル量産に入りました。製造は TSMC の 3nm に微細化し、推論性能は Blackwell 比で最大 5 倍、1 トークンあたりのコストは最大 10 分の 1 を掲げています。本格的な普及は 2026 年後半からの見込みです。
価格は高性能 GPU 1 枚で数万ドル、ラック 1 本では 1 億円規模になることもあります。それでも需要が供給を上回り、注文から納品まで数ヶ月待ちが常態化しています。NVIDIA が強いのは GPU 単体ではなく、GPU 同士をつなぐ高速接続(NVLink)と、開発者が使うソフト基盤(CUDA)まで含めた「箱ごと」の完成度です。
02挑戦者①:クラウド各社の「自社チップ」
NVIDIA への支払いを減らし、自社サービスに最適化するため、大手クラウドは独自の AI チップを作っています。NVIDIA から買うだけでなく「自分で設計する」側に回ったのが、ここ数年の大きな変化です。
| NVIDIA GPU(汎用) | クラウド自社チップ(専用) |
|---|---|
| 誰でも買える。CUDA で動く資産が豊富 | そのクラウドの中でしか使えないことが多い |
| あらゆる用途に対応する万能型 | 自社の学習・推論に最適化しコストを下げる |
| 調達競争が激しく価格も高い | 外販より「自社の NVIDIA 依存を減らす」のが主目的 |
- Google TPU:最も歴史が長い自社チップ。2026 年時点の最新世代は第 7 世代「Ironwood(TPU v7)」で、1 チップあたり 192GB の大容量メモリ(HBM)を積み、数千チップを 1 つの塊(Pod)としてつなぎます。Gemini の学習・推論を支え、クラウド(GCP)経由で Anthropic などの外部にも提供されています。
- AWS Trainium / Inferentia:Amazon の AI 専用チップ。学習用の最新世代「Trainium3」は TSMC 3nm 製で、1 チップ 144GB の HBM3e を搭載。Anthropic を主要顧客とする巨大クラスタ「Project Rainier」では、Trainium 系チップが合計でおよそ 100 万個規模に達しています。狙いは NVIDIA より安い学習・推論コストです。
- Microsoft Maia / Cobalt:Azure 向けの自社チップ。OpenAI モデルの運用や Azure 顧客向けに、NVIDIA 依存と運用コストを下げる目的で開発が続いています。

