AIコストが売上よりも速く伸びている理由

Dev.to / 2026/5/18

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisTools & Practical Usage

要点

  • 多くのスタートアップは、LLMを統合してから約6か月で「コストの壁」にぶつかり、API支出が売上よりもはるかに速く増えると指摘されています。
  • この記事は、課題はモデルの価格そのものではなく、どのユーザーや機能、リクエストでコストが発生しているかの可視性不足だと主張しています。
  • サポートでのエージェントループやRAG処理(PDFの分割・埋め込みなど)が、コストを特定のヘビーユーザーに偏らせやすいことを示しています。
  • ユーザー(テナント)ごとの原価配賦がないと、収益性の高い顧客と低い顧客を見分けられず、粗利が悪化した際に価格体系を調整できないと述べています。
  • 解決策として、早い段階からテナント単位での利用状況を追跡することを推奨し、モデル別・ユーザー別・日別にLLM APIコストを可視化するオープンソースのLLMeterにも言及しています。

ほとんどのスタートアップがLLMを導入すると、6か月目あたりでまったく同じ壁にぶつかります。

ユーザー成長は順調に見えます。ARRも伸びています。ですが、OpenAI/Anthropicの請求額はMRRよりも3倍のスピードで増えているのです。すると突然、粗利率がマイナスになり、しかもなぜか分かりません。

今年、私は何十人もの創業者に話を聞きました。ほとんど全員が最初は同じです。グローバルなAPIキーを1つ使う、キャッシュはなし、そして「コストは後で考えればいい」という考え方。後で、というのは通常、StripeがAPI請求額をカバーできなくなるときです。

問題はモデルの価格ではありません。GPT-4o miniやClaude 3.5 Haikuは安い。問題は可視性の欠如です。

顧客が問題について不満を言ってくると、サポートチームはエージェントのループを回します。ユーザーがPDFをアップロードすると、RAGパイプラインは50ページをチャンク化して埋め込みます。誰がそのコストを払っているのでしょう? どの顧客が実際に利益を生んでいるのでしょう?

たいていの場合、パワーユーザーの20%がAPI予算の80%を燃やし、残りがそれらを補助しています。しかしテナントごとのコストを紐づけられないと、見分けがつきません。価格ティアも調整できません。

ユーザーごとのコストを追跡していないなら、あなたは手探りで飛んでいる状態です。

テナントごとの利用を早い段階から追跡してください。トークン数をデータベースにログとして残すだけでも、何もしないよりはマシです。
なお、もし自分で作りたくないなら、私がLLMeter(https://llmeter.org?utm_source=devto&utm_medium=article&utm_campaign=2026-04-15-devto-ai-costs-revenue)を作りました。これはオープンソースのダッシュボードで、モデル別・ユーザー別・日別にLLM APIコストを追跡します。OpenAI、Anthropic、DeepSeek、OpenRouterに対応しています。

利益率がどこで消えたのか、推測するのはやめましょう。