ある登壇者(VC)は、AIネイティブ・スタートアップを評価する指標は「エンジニアあたりのARR」であり、その数値は上がっていくべきだと言っていました。今年、エージェントが本番稼働に入ったときに壊れた何かを直すための“解決策”を売りに来ていたのが、AI Agents Conferenceのほぼすべての講演とブースでした。観測可能性、ガバナンス、スーパー バイザー・エージェント、データ基盤、そして「誰かがボットを監督しないといけない」。
しかし、数年後に実際に残っているのは何でしょう?守れるのは何で、耐久性があるのは何でしょう?
昔のSaaSの売り文句はシンプルでした。高価なエンジニアリング投資とドメイン知識を、ツールにまとめます。あなたはツールにお金を払い、そのツールから成果(アウトカム)を生み出せる。ただし、ソフトウェア会社が、その成果が実際に生み出す価値に“本質的に整合”していることは稀だ、というものでした。
それが、両端から崩れています。これから向かおうとしている「頭の中の発想から直接作る」時代では、エンジニア労働力がほぼ無料に近づいています。最も示唆的なトレンドの1つが、エンジニアチームの規模を自慢する企業から、「エンジニアあたりにどれだけARRを生み出せるか」を語るようになっている点です。
ドメイン知識があれば、そうしたブースが売っていたものの大半は、数日〜数週間で雰囲気コード(vibe-code)で再現できます。従来のソフトウェアモデルは、実は“未活用”を前提にしていました。最も利益が出ているSaaS企業は、顧客がそれを十分に使っていないことが多い企業です(顧客に対しては定額だが、ベンダー側はクラウドコストが変動)。
価格設定は「トークン課金(token markup)」へ移っています。アウトカムの価値がより高くなるので、ソフトウェアに対する売上は2〜4倍になるかもしれませんが、マージンは圧迫されます。取引的なインテリジェンス(つまり、多くのシステムを動かすLLMを動かすコスト)は、本質的にトークンコストをアウトカムの価値に対して裁定(アービトラージ)しているだけだからです。
だからあのフロアの全員が、暗黙のうちに「古いものに代わる新しい牙(モート)に賭けている」状態でした。ですが、私はそれらが長く持ちこたえるとはあまり自信がありません…
最も人気だった賭けは、「エンコードされたドメイン知識」(例:法務AIプラットフォームのHarveyのセールスエンジニアは実際に弁護士)へのものでした。これは“今”はうまくいくと思います。理由は、私たちがまだ「この技術は魔法みたいに動く」という段階にいるからです。ですが、それが本当に耐久的かどうかには、私はあまり確信がありません。
なぜなら、プロンプト・アーキテクチャはテキストだからです。持ち運びができます。その下にある専門性はしばしば豊富です(例えば、米国には100万人以上の弁護士がいます)。このカテゴリの“正しい運命”は、プロンプト・アーキテクチャのオープンなマーケットプレイスや、クラウドソースされたベストプラクティスになるべきです。取引秘密(トレードシークレット)ではありません。クローズドなプロンプト・モートを作ろうとしている会社は、より速く反復できるオープンなものに負けるはずです(これは、ソフトウェアエンジニアリングの多くが急速に“エージェント的”なエンジニアリングへとコモディティ化していき、さらに既製のGitHubリポジトリが増えているという事実と、そのまま対応しています)。
データ基盤を追いかける人は多くいます。要するに、それは初期のWebの頃に似ています。誰もが、レガシーデータを動的な標準ベースのWeb UIに対応できるように公開しようと必死になっていました。エージェントは、これらのWebアプリに比べて100〜1000倍のデータ要求があるので、それらをつなぎ、統治し、規制上の義務に適合させるためのツールが必要になるのは自然です。
新しい参入者はさらに進め、データベース、パイプライン、Slackのスレッド、チケットをコンテキストグラフにつなぎ、その上でエージェントが推論できるようにします。先ほど述べたように、これらのすべてはまだ“魔法”に見えます。データベースを接続し、エージェントがスキーマを巡回して、チャットボットのインターフェースや簡単に変更できるダッシュボードを生成するのを見る。
しかし魔法を取り除くと、これらの多くは、LLMの上に載ったプロンプト・アーキテクチャと、データ取り込み(インジェスト)のレイヤーです。データアクセスの標準が成熟し(MCPはすでにそれを行っています)そしてプロンプト・アーキテクチャがオープンソースになれば(こうした知見の多くが、ますますLLM自体に事前学習として取り込まれていくことも含めて)、その“魔法”はもはや独自のものではなくなります。あなたは、自社の顧客のエンジニアチームが社内で構築したのと同じアーキテクチャに対して防御することになるでしょうし、客観的にそれより優れているオープンソース版に対しても防御することになるでしょう。
観測可能性(オブザーバビリティ)の既存勢力:うまくやれる可能性はありますが、それにはStripeのような“ユビキタスさ”(誰もが信頼することが最優先価値になる状態)が必要です。少なくとも、今の時点でStripeを信頼していない人がいるでしょうか?生き残るのは、おそらく純粋な観測可能性のままでいるよりも、監査とコンプライアンスの機能と融合する会社です。
だからこそ私は、重要だと思える1つのアービトラージ(裁定)にいつも戻ってしまいます。それは「信頼」です。これは特に規制された業界で重要になるはずですが、私には昔の(とはいえ、今ではおかしいほど時代遅れになっている)「IBMを選んでも誰も首にされなかった」という格言を思い出させます。競合が週末で雰囲気コードで実装でき、顧客が銀行なら、なぜ彼らはあなたに50倍も払うのでしょう?それはエンジニアリングではありません。たぶん専門性ですらありません。データ配管はコモディティ化してしまうので、それも違います…では何か。それは、あなたがリスクを、実際にリスクを価格付けして防御できる第三者へ移したからです。SOC2、法廷や議会で証言する指名されたCEO、電話に出る法務チーム、引受人(アンダーライター)向けのインデムニティ(補償)ラッパーです。つまりこれは、R&Dをパッケージする方法というより、金融化(フィナンシャライゼーション)の“ラッパー”へとコモディティ化が進むことを意味するのかもしれません(FinTechスタートアップはまた前面に戻るの?!)。
私が実際に賭けるつもりの、この未来の形はこうです。コモディティな基盤(LLM+オープンなプロンプト・アーキテクチャ+標準化されたデータアクセス)に、規制された保険会社が薄いレイヤーとして載っていて、コンプライアンス主導の産業におけるエージェントの失敗リスクを価格付けする、というものです。中間層(プロンプト・アーキテクチャをプロダクトとして売るベンダー)は、非常に多くの場面でマージン圧迫に対して脆弱です。
フロアのほとんどの人は、その中間層を作ろうとしていました。
[link] [comments]




