AIクォータのインフレは手間いらず。最初から織り込まれている
前にもここに来た。この先は、抜け出せないかもしれない
意見 芸術の創作に携わる人たちのファンは、作り手がどこに集まって自分たちだけで語り合うのかを知ると、次にその“達人たち”が何を話しているのかをこっそり聞き耳を立てに行くものだ。黄金の洞察、大胆な発想、最先端の思考? まったく。運がよければゴシップ。運が悪ければ旅行のつらさ。だいたい皆、金の話をしている。
LLMでも同じだ。ただし、金を直接話す代わりに、人々はトークンのことを話している。AIコーダー向けニュースにおける毎日の定番――「別の機能がAI化された」、また別の「“バグ”がサブスクの会計処理で修正された」、さらに挙動の変更。しかも共通点が1つある。TIBS、つまりトークンの増分バーン症候群だ。TIBSの始まりに差しかかっているのかもしれないが、AIをパンデミックにたとえる比喩を続けるなら、これから来るものは本当にまだまだ大量にある。
トークンは、LLM利用の“課金対象”として単に分かりやすい計測単位だから使われる――たとえ、それがトークンを数える人たちの一部を挑発しているように見えるとしても。LLMにプロンプトを投げると、それは語彙(1930年代に遡る言語学の用語で、「意味」と「修正」の単位)を認識する。これらは表現に変換され、トークンとなって、LLMの巨大な「次は何だろう?」推測マシンへ投入される。その結果、出力トークンの列が得られ、それがあなたのために、言葉やコンピュータコードなどへ変換される。入ってくるトークンを数え、出ていくトークンを数える。これは……
if ((ntokens_left -= (strlen(prompt) + strlen(slop))) <= 0) {
printf("Cough up, sunshine
");
……とまあ、言うほどではないにせよ、かなり近い。こうした発想の上に、AIの商業的な仕組み全体がぶら下がっている。
コードの提案、生成、あるいはAIデバッグのためであれ、トークン消費に基づいてコストを決めるのは、理屈としては――いや、正確に言えば、それ以上に――「入力キーや出力文字の数でプログラマーに払う」よりまだ筋が通っている。とはいえ、それより愚かだと言っていいのが「月あたりのコード行数でコーダーの良し悪しを測る」という指標で、あまりに頭の悪い概念なのでJuiceroの支援者までウォーレン・バフェットに見えてしまう。実際に“使える仕事”として成し遂げられたものの概念がなく、非効率が報われてしまう筋書きもなく、支払った価格と生産コストを実際のところ結びつける簡単な方法もない。だがシンプルに理解でき、他の前払い型・制限付き利用サブスクモデルに見える。奇妙なことに、誰もこれを改善しようという気配がない。
実質的に他の指標はほとんどありません。ベンチマークのテストケースとして、1秒あたりのトークン数を測ることはできます。トークンアウト(出力)対トークンイン(入力)の比率を測ることもできますが、なぜそれが分かりやすいのかは必ずしも明確ではありません。少なくとも、クラウドコンピューティングのように比較的同等なサービスモデルなら、計算資源、メモリ、ストレージ、そして接続性に対してそれだけの計算コストを払えば何を得られるかは分かっています。それでも、自動化の暴走や運用の取り違えは監視する必要がありますし、「請求額の急騰(Bill Shock)」もAWSではまだ起こり得ますが、結果をコストに結び付けられる可能性はあります。LLMベースのサービスや、ましてやAIエージェントであれば、なおさらです。
この価値の欠如という指標の不在を、AI業界が約束を果たすために示さねばならない、あまりにもばかげた投資対効果(ROI)に加えると、TIBS(※インフレ的な課金上昇)の土台を積み上げるためのレシピができあがります。
ベンダーは、何でもサブスクリプションにしたがり、そして、効果的な独占を取り込めるとなれば、なおさら解約しにくい加入者を“ゆで上げる(frog-boiling)”中毒があります。組織が人間のコード制作をスキルダウンさせ、特定のAIコード生成チェーンに依存するようになったときのロックインを想像してみてください。
移行(Migration)という言葉は、たとえその必要性が電話帳のような数々の指標で裏付けられていたとしても、口に出しにくいものです。インスタンスあたりのコストや、テラバイトあたりのコストを見ればよいでしょう。そしてビジネスモデルを健全に保つために何が必要になるかも見積もれます。そうすれば、少なくとも全面的に間違っていないかもしれません。AI比率の高いCI/CDでそれがどう機能するのかは大きな疑問で、あなたが誰かに先に答えさせたいと思うかもしれません。
- AIが法曹界という冷酷で現実的な“壁”にぶつかったとき何が起きたのか
- Appleのチップは新しい地形の中核だが、最大の勝ちはWindows
- Googleは報道においてヴァイキングが修道士にしたのと同じことをする。今度は彼らの男がBBCを運営する
- 企業の“BS”(ごまかし)を指摘する? それなら、狙うべき“湯気の立つ山盛り”がある
業界のベンダー側とインフラ側は、これまでもずっと、ロックインが封建制につながり、それが革命につながり、さらに革命家自身が自分たちで地代取りの地主になるというサイクルを見てきました。60ワードで70年分のエンタープライズITを語れる? それじゃ、しっかりつかまっていてください。
レンタルメインフレームからオンプレのミニコンピュータへ、ミニから自律的なデスク上のマイクロへ、少なくともイーサネットが仮想ミニを作り直し始めるまでは。専有からオープンソースへ。オープンソースでユビキタスになり、実質的に無制限の計算資源でハイパースケーラーを築き、クローズドなサービスを動かす。次に、ユーザーごとのクォータでオフプレのメインフレームに私たちを引き戻すような、ハイパースケールのアーキテクチャでAIモデルを駆動する。そしてまた、クローズドなサービスとユーザーごとのクォータへ。
こうしたサイクルはムーアの法則によって支えられてきました。ムーアの法則は、ITの経済性を絶えず変えることで、IT業界に惰性が生まれるのを抑止しようとします。しかも、その業界はまさにそれを切実に欲しているのに。
ムーアの法則は終わりました——いや、本当に終わっています。面積密度は今や体積密度になったため、より安く、より小さく、より省電力で、より民主的になっていく代わりに、シリコン技術は価格、サイズ、省電力への執着、そして封建制への執着で“肥大化”しています。AIだけが市場を動かせる唯一の“動物”であり、それであり続けるには、あなたから餌を食べ続ける必要があります。TIBSこそがその答えです。あなたの領地を耕せ、農奴たち。
もしAIが本当に技術労働者のスキルを奪い、IT創出のエンジンを取り戻すことにつながるのだとしたら、それは半導体の進化の始まりではなく、半導体進化の“終わり”にメインフレーム時代が訪れたかのようになるでしょう。物事を前に進める進化の原動力について言えることは、それは50年もの間探しているにもかかわらず、まだ発明されていないということだけです。
AI業界はギガワットで増築し、トークンで請求します。そして、深いロックインが永遠にルールを決められる未来を“設定”する匂いを嗅ぎつけています。私たち他の者は、もともと存在する、感覚を持つシリアルポート接続のメインフレーム——『ウォーゲーム』のWOPR——の言葉を思い出すべきです。「唯一の勝ち筋は、プレイしないことだ。」そういうことを理解しているはずです。®
より絞り込まれたトピック
- AdBlock Plus
- AIOps
- Amazon Bedrock
- Anthropic
- API
- アプリ
- アプリケーションデリバリーコントローラー
- Audacity
- ChatGPT
- Confluence
- データベース
- DeepSeek
- FOSDEM
- FOSS
- Gemini
- Git
- Google AI
- GPT-3
- GPT-4
- Grab
- グラフィックス交換フォーマット
- IDE
- 画像圧縮
- Jenkins
- レガシーテクノロジー
- LibreOffice
- 機械学習
- マップ
- MCubed
- Microsoft 365
- Microsoft Office
- Microsoft Teams
- モバイルデバイス管理
- ニューラルネットワーク
- NLP
- OpenOffice
- プログラミング言語
- QRコード
- 生成拡張検索
- レトロ・コンピューティング
- 検索エンジン
- ソフトウェア部品表
- ソフトウェアのバグ
- ソフトウェアライセンス
- スター・ウォーズ
- テンソル処理装置
- テキストエディタ
- TOPS
- ユーザーインターフェース
- Visual Studio
- Visual Studio Code
- WebAssembly
- Webブラウザ
- WordPress
より広い話題
詳細はこちら
より絞り込んだ話題
- AdBlock Plus
- AIOps
- Amazon Bedrock
- Anthropic
- API
- App
- アプリケーション デリバリー コントローラー
- Audacity
- ChatGPT
- Confluence
- データベース
- DeepSeek
- FOSDEM
- FOSS
- Gemini
- Git
- Google AI
- GPT-3
- GPT-4
- Grab
- グラフィックス交換フォーマット
- IDE
- 画像圧縮
- Jenkins
- レガシー技術
- LibreOffice
- 機械学習
- マップ
- MCubed
- Microsoft 365
- Microsoft Office
- Microsoft Teams
- モバイル デバイス管理
- ニューラルネットワーク
- NLP
- OpenOffice
- プログラミング言語
- QRコード
- リトリーバル拡張生成
- レトロコンピューティング
- 検索エンジン
- ソフトウェア部品表
- ソフトウェアのバグ
- ソフトウェア ライセンス
- スター・ウォーズ
- テンソル処理装置
- テキストエディター
- TOPS
- ユーザーインターフェース
- Visual Studio
- Visual Studio Code
- WebAssembly
- Web ブラウザー
- WordPress


