このスタートアップは「トークン・マキシング」が次の計算(コンピュート)大手を生み出すと賭けている

TechCrunch / 2026/4/15

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIndustry & Market Moves

要点

  • 推論(inference)時に生成AIモデルを実行するためのクラウドプロバイダーであるParasailは、1日あたり約5000億トークンを処理しており、「トークン・マキシング」需要に注力していると述べている。
  • ステルス期間を経て同社は、15カ国・40データセンターにまたがるオンデマンドGPUのグローバル・フリートを拡大するため、シリーズAで3200万ドルを調達した。推論を高速かつ低コストに保つことを目指している。
  • Parasailはチップの完全保有にはこだわらず、自社GPUと市場から調達した処理能力の組み合わせから処理時間を賃借する方針をとる。需要のピークを避け、コストを下げるために配分をオーケストレーションする。
  • この記事では、Parasailの成長は、フロンティア・ラボ以外にもオープンソースのモデルやエージェント型システムが広がるかどうかに左右されると論じている。その背景には、大手のクローズドなモデル提供企業によるコストや摩擦(フリクション)があるという認識がある。
  • より広範なハイブリッド推論(inference)エコシステムが形成されつつある。例として、Elicitが製薬企業向けに取り組んでいる研究で、LLMベースのリサーチ・ワークフローを用いて数万本の論文を分析している点が挙げられている。

「トークンをくれ。とにかくトークンをくれ。早く欲しい。安くしてほしい。今すぐ欲しい。」

生成AIモデル上でソフトウェアを開発する開発者向けの、少なくともParasailのCEOであるマイク・ヘンリーが耳にしているものが、こうした“合言葉”です。Parasailは、推論のためにAIモデルを動かす企業向けのクラウド計算サービスを提供しており、ヘンリーはTechCrunchに対し、1日に5000億トークンを生成すると語っています。トークンマックス(tokenmaxxing)としてはどうですか?

ヘンリーは、LLMに注力するチップメーカーのGroqでエグゼクティブを務めており、同社のクラウド提供を構築しました。AIモデル上でソフトウェアを開発する開発者は、自分たちのニーズに合わせたクラウド処理を望むだろう、という早い段階での認識だったわけです。現在は、去年“ステルス状態から”脱した後、Parasailはそれを大規模に実現するために、シリーズAで3200万ドルを調達しました。

ヘンリーには物理チップ設計の経歴がありますが、Parasailは自社のチップ所有に固執しているわけではありません。一部のGPUは自社製ですが、同社は主に、世界の15カ国にある40のデータセンターで処理時間をレンタルしており、さらに流動性市場からも追加で調達しています。そしてそれらを裏側で統括し、推論リクエストのコストを引き下げています。

同社は、ワークロードを賢く配分し、需要のピークを回避することで、自社のシリコンを所有している企業、そして既存の顧客コミットメントやワークロードによって制約を受けうる企業との競争を目指しています。

同社の潜在力は、フロンティアラボの外でのオープンソース・モデルやエージェントの普及が続くかどうかにかかっています。Parasailの幹部や投資家は、これがAnthropicやOpenAIのような企業の提供物を使うコストの増大と摩擦の高まりによってもたらされている、としています。

代わりに、ハイブリッドなアーキテクチャが台頭していると、研究用アシスタントを開発するスタートアップであるElicitのCEO、アンドレアス・シュトゥールミュラーは述べています。同社はシリーズAで2200万ドルを調達しています。彼の顧客である大手製薬会社では、LLMベースのツールを使って、数万本規模の科学論文からデータをレビューし分析しています。

Techcrunch イベント

Disruptで、次の投資家やポートフォリオのスタートアップに出会おう


次のラウンド。次の採用。次のブレイクのチャンス。TechCrunch Disrupt 2026では、10,000人超の創業者、投資家、テックリーダーが3日間にわたり、250以上の戦術セッション、強力な引き合わせ、そして市場を形作るイノベーションに集います。今すぐ登録して最大$410を節約しましょう。

Disruptで、次の投資家やポートフォリオのスタートアップに出会おう


次のラウンド。次の採用。次のブレイクのチャンス。TechCrunch Disrupt 2026では、10,000人超の創業者、投資家、テックリーダーが3日間にわたり、250以上の戦術セッション、強力な引き合わせ、そして市場を形作るイノベーションに集います。今すぐ登録して最大$410を節約しましょう。

サンフランシスコ、CA | 2026年10月13-15日

「100,000件ものリクエストをAPIのエンドポイントに送るのは、かなり大変なので、オープンモデルへ寄せてきました」とシュトゥールミュラーはTechCrunchに語っています。特に、同社が提供内容を改善するためにエージェントに頼っており、タスクを分割し、より長い時間軸で戦略的に動くようになってからはなおさらです。オープンモデルは、作業のコストを下げるための最初のスクリーニングを担い、その後に、より能力の高いフロンティアモデルが最終的な回答を返します。

エージェントがソフトウェア開発においてますます一般的な要素になっていくにつれて、モデルへの問い合わせが増えていることが、安価な推論のためのインフラを提供するParasailのような企業への投資を後押ししています。このラウンドを共同で主導したTouring Capitalのパートナー、サミール・クマールは、将来は推論コストがソフトウェア開発費用の少なくとも20%を占めるようになると見込んでいるとTechCrunchに語りました。

では、その市場のうちParasailがどれだけを取れるのでしょうか。混雑したクラウド計算の領域の中で、ヘンリーは、自社が推論(学習は禁止)に注力していること、そして長期コミットメントなしでスタートアップ顧客を引き受ける姿勢が、大企業向けビジネスに焦点を当てた大手クラウド計算企業、さらにはFireworks AIやBasetenのような、クラウド推論分野で資金がより潤沢な競合他社と比べて自社の提供価値を際立たせていると主張しています。

もちろん、顧客が全員、予測不能なAI領域でのシード期およびシリーズBのスタートアップである場合は、別種のリスクもあります。

今回の資金調達を共同で主導したもう一人のリードである、Kindred Venturesのパートナー、スティーブ・ジャンは、モデルを展開するための経済性は、Parasailが提供するような計算ブローカーの形態を必要とするだろうと言います。そして、それはコンテンツ生成やロボティクスにモデルが広く使われるようになる前の話です。

「誰もがAIバブルがあると思っていた。AIバブルはないんです」と彼はTechCrunchに語りました。「推論需要が供給を大きく上回っている。」