私はLLMで約2年ほど開発してきました。Claude、GPT-4、Gemini——タスクに応じてそれらを使い分けています。そして最初の1年半は、リアルタイムでそれらが実際に自分にいくらかかっているのか、ほとんど何も見えていませんでした。
これが問題です。誰もそれについて話していません。
皆が話しているのは どれ のモデルを使うべきかということです。どれが賢いのか、1百万トークンあたりどれが安いのか、どれが長いコンテキストをよりうまく扱えるのか。リリースされたあらゆるモデルを比較するベンチマークやブログ記事、Twitterスレッドがあります。
でも、実際の日々の問題は? コーディングセッションの真っ最中です。Cursorを開いていて、ClaudeにAPI経由で直接プロンプトを投げている。さらに、サイドタスクのためにGPT-4oを呼び出す小さなスクリプトを持っているかもしれません。なのに、たまっていくものが何なのか全く分からない。
請求書は月末に届きます。そしてそれはただの……数字です。$23。$67。$112。文脈なし。どのセッションが破裂したのか分からない。ある同じプロンプトを延々とリトライしていたあの午後のせいなのか、起動していることを忘れていたバックグラウンドエージェントのせいなのか、判断する術がありません。
コスト可視性のギャップ
変だと思う点がここです。私たちは、他のあらゆることを 全部 計測している。
メモリ使用量? それ用のウィジェットがあります。CPU? メニューバー。ネットワーク? もちろんあります。データベースのクエリ時間? ログに残してグラフ化されています。
しかし、AIのトークン支出——おそらく現代の開発で最も変動が大きく、最も予測しづらいコスト——は、リアルタイムの可視性がゼロです。月次の請求書が届いて、ぼんやりとした不安だけが残る。
私はAI支援開発により強く踏み込むほど、この点に気づくようになりました。ある日はほとんど何も使わない。別の日は、問題解決モードで、Claudeと延々往復しながら厄介なものをデバッグしていて、気づかないうちに驚くほどの量を消費してしまう。
これらのプラットフォームの利用状況ダッシュボードは……まあまあです。存在します。でも、ブラウザを開いてログインして、請求(billing)に移動する必要があります。その時には、すでに自分がやっていたことからコンテキストが切り替わってしまっている。誰も、フロー状態の途中でそこを確認しません。
私が本当に欲しかったもの
私は、他の何に対してもそうであるように、同じものが欲しかった。周辺状況の把握です。
ダッシュボードじゃない。週次メールでもない。ただ——常にオンで、ちらっと見ただけで分かる、リアルタイムの数字。CPUのメーターがただ そこに居座っていて、考えなくてもパッと確認できるのと同じように。
そこで私は TokenBar を作りました。これはmacOSのメニューバーアプリで、OpenAI、Anthropic、Geminiにまたがるあなたのトークン使用量と支出をリアルタイム表示します。メニューバーに置いたままで、リアルタイムに更新されます。
クリックすると内訳が見えます。今日のプロバイダ別の支出、トークン数、そして最も食っているのがどのモデルか。私がずっと「こんなのがあればいいのに」と思っていたものそのものです。
この問題が悪化している理由
AIコーディングツールが良くなるほど、トークン使用量の問題はさらに複雑になります。Cursor、GitHub Copilot、Windsurf、Zed——これらのツールはすべて、あなたの代わりにAPI呼び出しを行い、その回数はしばしば想像以上です。平たく月額サブスクリプションの場合は、直接的に痛みを感じにくい。でも、それらと並行して自分でも直接API呼び出しを行っているなら、コストが複数のシステムに分散し、統一された見通しがない状況になってしまいます。
また、モデルはトークンあたりの価格が下がっている一方で、賢くもなっています——だから もっと の用途に使われる。結果として、1トークンあたりの料金が下がっているのに、総支出は意外なほど高いままになります。
不意打ちを食らうのは、「トークンあたりが安い」=「請求が下がる」という前提で考える開発者たちです。そうはなりません。たいていは「これまで正当化できなかった用途にも、今なら使える」という意味です。
解決策は地味だけど本物
解決策は、複雑なオブザーバビリティ(可観測性)プラットフォームではありません。そうする必要もありません。ほとんどの個人開発者や小規模チームにとっての修正は、ただこれです:請求書が届く前に、自分が何にいくら使っているかを知ること。
メニューバーに表示された1つの数字。正直、それでだいたい十分です。毎日の支出がじわじわ上がっているのを見れば調整します。特定のワークフローが高くつくと分かれば最適化します。月の上限予算があるなら、実際にその範囲内に収められます。
私は TokenBar を作りました。自分自身のためにこれが必要だったからです。$5の生涯プラン、サブスクリプションなし。単に、初日から存在していて然るべき可視性が手に入るだけです。
もしAIのAPIに実際のお金を払っているなら、あなたにもたぶんこれが必要でしょう。



