Startup Gimlet Labsは驚くほどエレガントな方法でAI推論のボトルネックを解決している

TechCrunch / 2026/3/24

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIndustry & Market Moves

要点

  • Gimlet Labsは、異種のハードウェアにまたがってワークロードを実行できる「マルチシリコン推論クラウド」を通じてAI推論のボトルネックに取り組むため、シリーズAで8,000万ドルを調達した。
  • 同社のソフトウェアにより、AIアプリケーションを分割して、さまざまな段階で最適なリソース(CPU、AI最適化GPU、高メモリのシステムなど)を使用できる。
  • 投資家は推論(inference)を計算(compute)ボトルネック、デコード(decode)をメモリ(memory)ボトルネック、ツール呼び出し(tool calls)をネットワーク(network)ボトルネックと位置づけている。つまり、エンドツーエンドの性能は、各ワークロード段階に適したハードウェアを割り当てることに左右される。
  • Gimlet Labsは、データセンターのハードウェアの多くが十分に活用されていない(既存能力の約15〜30%しか使っていないアプリがある)と主張し、自社のアプローチによって効率を最大10倍まで改善できるとしている。
  • 同社は、自社製品を「新しいチップが投入され、古いGPUが再投入される」局面でも、複数ハードウェアの「フリート」を機能させるための、欠けていたソフトウェア層だと位置づけている。

スタンフォードのアジャンクト・プロフェッサーで、そして成功裏に事業をエグジットした創業者のザイン・アズガルが、AI推論のボトルネック問題を巧妙に解決するスタートアップとして、シリーズAで8,000万ドルを調達した。ラウンドはメンロ・ベンチャーズが主導した。 

同社はGimletLabsといい、自社が「最初で唯一の“マルチシリコン推論クラウド”」だとしているものを開発した。これは、AIワークロードを多様な種類のハードウェアに対して同時に実行できるようにするソフトウェアだ。従来型のCPUとAI向けに最適化されたGPU、さらに大容量メモリを備えたシステムの双方に、AIアプリの処理を分割できる。  

「基本的には、利用可能なさまざまなハードウェアにまたがって実行します」と、アズガルはTechCrunchに語った。 

1つのエージェントは複数のステップを連結する場合があり、それぞれが「異なるハードウェアを必要とする。推論は計算(compute)依存、デコードはメモリ(memory)依存、そしてツール呼び出しはネットワーク(network)依存」だと、リード投資家でメンロのティム・タリーが資金調達に関するブログ投稿で書いている。  

現時点ではどのチップもそれをすべてはこなせない。しかし新しいハードウェアが投入され、古いGPUが再配置されていくにつれて、「マルチシリコンの部隊(fleet)は準備できている。あとは、それを動かすためのソフトウェア層が欠けているだけだ」。タリーはGimletLabsが提供しているのはまさにそれだと考えている。

「推論するための別の見方をすると、遊休になっているリソースを放置しているだけなので、数千億ドルを無駄にしていることになる」と彼は言った。「私たちの目標は、今日の時点で、AIワークロードをこれまでの10倍以上効率的にできる方法を突き止めようとすることでした。」 

Techcrunch イベント

Disrupt 2026: テックエコシステムを1つの部屋に

次のラウンド。次の採用。次のブレイクのチャンス。 TechCrunch Disrupt 2026にて、10,000人以上の創業者、投資家、テックリーダーが3日間集結。250以上の戦術セッション、強力な紹介、そして市場を定義するイノベーションが満載です。最大400ドル分の割引で今すぐ登録。

最大300ドルまたは30%割引でTechCrunch Founder Summitへ

1,000人以上の創業者と投資家がTechCrunch Founder Summit 2026で一日を通して集結。成長、実行、そして現実のスケールにフォーカスします。業界を形作ってきた創業者や投資家から学びましょう。同じような成長段階を歩む仲間とつながりましょう。今すぐ適用できる戦術を持ち帰れます

オファーは3月13日に終了。

サンフランシスコ, CA | 2026年10月13日〜15日

そこで彼と共同創業者のミシェル・グエン、オミッド・アジジ、ナタリー・セリーノは、エージェント型のワークロードを切り分けて、あらゆる種類のハードウェアに同時に分散できるようにするオーケストレーション・ソフトウェアの構築に取りかかった。 

GimletLabsは、同じコストと消費電力でAI推論を確実に3倍から10倍高速化できると主張している。Gimletによれば、基盤となるモデルを分割し、モデルの各部分に最適なチップを使って、異なるアーキテクチャにまたがって実行することさえ可能だという。 

同社はすでに、NVIDIA、AMD、Intel、ARM、Cerebras、d-Matrixのチップメーカーと提携している。  

Gimletの製品は、ソフトウェアとして提供するか、あるいは自社のGimletCloud経由のAPI経由で提供される。これは一般のAIアプリ開発者向けではない。対象は最大規模のAIモデルラボとデータセンターだ。 

同社は10月に、当初から“桁違いの売上”(少なくとも1,000万ドル)だと公表しつつステルス状態を解除して公開した。アズガルは、顧客基盤は過去4か月で2倍以上になり、主要なモデルメーカーと、非常に大規模なクラウドコンピューティング企業が含まれるようになったと述べたが、社名は明らかにしなかった。  

共同創業者たちはそれ以前、Kubernetes向けのオープンソース可観測性ツールを作ったスタートアップ、Pixieで共同で働いていた。PixieはBenchmarkが主導したシリーズA(900万ドル)でローンチしてからわずか2か月後の2020年にNew Relicに買収された。(Pixieの技術は現在、Kubernetesを監督するオープンソース組織の一部になっている。)  

約1年前にアスガルが偶然タリーに出くわし、さらにスタンフォードの教授からエンジェル投資も受けたことで、VCが呼びかけてくるようになりました。ローンチ後、タームシートがアスガルのデスクに届きました。VCが「アスガルがオファーを見ているんだって?」と聞いたところ、「かなり大きな資金の群れが来ていて」、そのラウンドはすぐに上限を超える形で申し込みが殺到した、と彼は語りました。 

前回のシードにより、スタートアップは現在、合計で9200万ドルを調達しており、シーコイアのビル・コウクラン、スタンフォード教授ニック・マッキューン、VMwareの元CEOラグフ・ラグラム、インテルのCEOリップ=ブー・タンといった多数のエンジェルからも含まれています。同社は現在30人を雇用しています。

ほかの投資家には、シードを主導したファクトリー、エクリプス・ベンチャーズ、プロスペリティ7、トライアトミックが含まれます。