ほとんどのスタートアップがLLMを導入すると、6か月目あたりでまったく同じ壁にぶつかります。
ユーザー成長は順調に見えます。ARRも伸びています。ですが、OpenAI/Anthropicの請求額はMRRよりも3倍のスピードで増えているのです。すると突然、粗利率がマイナスになり、しかもなぜか分かりません。
今年、私は何十人もの創業者に話を聞きました。ほとんど全員が最初は同じです。グローバルなAPIキーを1つ使う、キャッシュはなし、そして「コストは後で考えればいい」という考え方。後で、というのは通常、StripeがAPI請求額をカバーできなくなるときです。
問題はモデルの価格ではありません。GPT-4o miniやClaude 3.5 Haikuは安い。問題は可視性の欠如です。
顧客が問題について不満を言ってくると、サポートチームはエージェントのループを回します。ユーザーがPDFをアップロードすると、RAGパイプラインは50ページをチャンク化して埋め込みます。誰がそのコストを払っているのでしょう? どの顧客が実際に利益を生んでいるのでしょう?
たいていの場合、パワーユーザーの20%がAPI予算の80%を燃やし、残りがそれらを補助しています。しかしテナントごとのコストを紐づけられないと、見分けがつきません。価格ティアも調整できません。
ユーザーごとのコストを追跡していないなら、あなたは手探りで飛んでいる状態です。
テナントごとの利用を早い段階から追跡してください。トークン数をデータベースにログとして残すだけでも、何もしないよりはマシです。
なお、もし自分で作りたくないなら、私がLLMeter(https://llmeter.org?utm_source=devto&utm_medium=article&utm_campaign=2026-04-15-devto-ai-costs-revenue)を作りました。これはオープンソースのダッシュボードで、モデル別・ユーザー別・日別にLLM APIコストを追跡します。OpenAI、Anthropic、DeepSeek、OpenRouterに対応しています。
利益率がどこで消えたのか、推測するのはやめましょう。



