韓国のAIチップスタートアップRebellions、ラックスケール侵攻の新天地を狙う
計画されているIPOに先立って資金調達ラウンドを実施
GPUメーカーのNvidiaやAMDがAIインフラ市場を席巻しているかもしれませんが、それでもなお、AIチップのスタートアップは数多くがひそかに活動しています。
そのうちの一社がRebellionsです。同社は韓国の地元で足場を固めた後、液体冷却や極端に高密度なラックを導入しなくても済む新しいラックスケールの計算(compute)プラットフォームから始めて、その技術を世界の他の地域にも持ち込もうとしています。
2020年末に設立された同社は、韓国国内市場の多数のアプリケーションに導入されているAIアクセラレータを製造しています。
当初について、Rebellionsのチーフ・ビジネス・オフィサー(CBO)マーシャル・チョイはEl Regに対し、「韓国市場では、通信事業者、サービスプロバイダー、そしてエンタープライズのエンドユーザーに対して、かなり多くの注力をしていました」と語りました。「コールセンターや顧客サービスから、国家ハイウェイ・システム向けのCCTV監視まで、あらゆるものをめぐるユースケースを積み上げてきました」。
「私たちは、これまでの年月の中で行ってきた学び、能力、改善を、韓国の外の他地域にも、刷新(まっさらなスタート)というよりは、“やり方を洗って繰り返す”といった動きで持ち出せる、とても強い立場にあります」と付け加えました。
同社は、Rebel Quadアクセラレータを導入したのち、Rebel100へとブランド名を変更しましたが、その後は世界の他地域へと照準を合わせてきました。ここ数か月でRebellionsは、日本、サウジアラビア、台湾、そして米国にオフィスを開設しました。同社はそこで、新しいRebelRackとRebelPodsを武器にエンタープライズの獲得を狙っています。
ラックを見る前に、まずチップそのものについて話しましょう。同社の姉妹サイトThe Next Platformは昨冬にRebel100を掘り下げましたが、要するに、このチップは2023年後半のNvidiaのH200アクセラレータとかなりよく似た見た目です。
Rebellionsによれば、このプロセッサは高密度の16ビット浮動小数点演算でペタFLOPを発揮でき、FP8ならその2倍だといいます。ただし、TSMCで製造されたモノリシックな計算ダイを使っていたH200とは異なり、Rebellionsの最新プロセッサは、Samsungが製造・パッケージングした4つの計算ダイによるチップレット構成を採用しています。
そのプロセッサには、合計144GBの容量を持つ4つのHBM3eスタックと、合計4.8TB/sの帯域幅が供給されます。
より小型の計算ダイや、Samsungへの依存が、歩留まりの改善や、TSMCの限られた製造キャパおよびパッケージングキャパをめぐる競合を避けるのに役立つとしても、HBMはどこかから調達する必要があります。メモリはすでに不足しており、HBMはその中でも最も入手が難しい部類です。
そこで効いてくるのが、SKの財閥(チャボル)やSamsungとのつながりが深い韓国企業であることです。SK HynixとSamsungは、世界最大のHBM供給元です。私たちが聞いている限り、RebellionsはHBMをSamsungから調達しているようですが、いざという時には、SK Hynixに一部のキャパを投入してもらうために、そこまで必死に争わなくても済むはずです。
チップ自体は現在、これまで私たちが慣れ親しんできたOAMやSXMモジュールではなく、PCIeカードとしてパッケージングされており、TDPは600ワットです。
Rebellionsのリファレンスデザインでは、これらのカードを8枚、1つの空冷ノードに詰め込むことを想定しています。
19インチ筐体などの標準的なフォームファクタと空冷といった高効率の設計ポイントが、Rebellionsにとって重要でした。これによりシステムを既存のエンタープライズデータセンターに導入できるからです。これは、Nvidiaの最新世代の液冷Rubin GPUには当てはまりません。
RebelRackにはこのノードが4つ搭載され、それぞれがクアッド400Gbpsのネットワーキングで接続されます。これにより、合計32台のアクセラレータとFP8で64ペタFLOPSの計算性能、HBM3eで4.6TB、合計のメモリ帯域幅は153.6TB/sになります。
より大規模な展開に向けて、Rebellionsは同社がRebelPodと呼ぶものも開発しています。RebelPodは8ノードから128ノードまでスケールでき、各ノードには8基のRebel100アクセラレータが搭載され、それらは800Gbpsのイーサネットで相互接続されます。
「今は、人々はラック単位のことを考えています。でもこれから数日たったら、行単位、そしてデータセンター単位のことを考えるようになると思います」とChoy氏は述べました。
GPUシステムと比べると、これはネットワーク量としては多くありません。現在のHGXシステムの多くは、少なくとも1GPUあたり800GbpsのNICを備えています。Choy氏によれば、今後はネットワークファブリックが同社の主要な注力領域になるとのことです。
- Alibabaは470,000個のAIチップを製造した。劣っている可能性があり、今後もそうかもしれないと認める
- NvidiaのGroq搭載LPXと、ほかの新しいラックシステムを読み解く
- Metaが、Broadcom製のカスタムAIチップ4種類を公開。市販のシリコンの一部を上回ると主張
- Nvidiaが支援するフォトニクススタートアップAyar Labsが、CPOチップレットを大量生産するために資金を集める
AMDやNvidiaのラック規模システムで見てきたように、パズルのピースは計算とネットワークの2つだけではありません。すべてを一体としてつなぎ込むソフトウェアも必要です。
Rebellionsのソフトウェアスタックは、特別に風変わりなものではありません。プラットフォームはvLLM、PyTorch、Tritonのようなオープンソースのフレームワーク上で動作すると聞いています。ディスアグリゲーテッド推論では、別のオープンソースフレームワークであるllm-dを使用しており、計算負荷の高いプリフィル処理をあるセットのアクセラレータで行い、メモリ帯域負荷の高いデコード処理を別のアクセラレータで行えるようにしています。
「vLLMコンパイラから、スタックの最上位に至るまで、Red Hat、OpenShift、そしてその間にあるすべてがオープンソースです」とChoy氏は語りました。「これらの技術を別の文脈で使ったことがあるなら、あなたはすでにRebellionsの使い方もわかっているはずです」
もちろん、これらの類似した主張は過去にもチップメーカーから聞いたことがありますが、実際に使ってみると、ここまで簡単ではなかったケースもあります。それでもRebellionsはPyTorch Foundationのメンバーです。これは多くのAIチップスタートアップには当てはまりません。
もちろん、どれも安くはありませんが、Rebellionsは資金に困っていません。月曜に同スタートアップは、Mirae Asset Financial Groupと韓国国家成長基金が主導するIPO前の資金調達ラウンドで4億ドルを調達しました。これは同社の西方への拡大を後押しし、より高性能で効率的なAIアクセラレータやシステムの開発をさらに進めるためでもあります。
最近の報道によれば、同社は今年中、あるいは来年初めにIPOの申請を行える可能性があります。®



