Claude Mythos プレビューが主要なOSとブラウザのあらゆるところで数千のゼロデイを発見。見出しが見落としていることは?

Dev.to / 2026/4/8

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • Anthropicは未公開の「Claude Mythos Preview」取り組みを事前に公開し、主要なOSとブラウザにまたがって数千件の重大なゼロデイ脆弱性を特定したとされ、なかには数十年前から存在するバグも報告されています。
  • 注目点は単なる脆弱性の検出にとどまりません。MythosはFirefoxのJavaScriptに対するテストで、見つかった問題の72.4%を実際に動作するエクスプロイトへと転換したとされています。さらに登録(レジスタ)制御を含むものが追加で11.6%あり、エクスプロイト生成能力が大きく飛躍したことを示唆しています。
  • 責任ある開示(Responsible disclosure)が進められているものの、重大な発見のうち完全にパッチが当たった割合は1%未満だと言われており、大規模な発見がパッチ適用能力を上回ってしまう現状が浮き彫りになります。
  • CyberGymのベンチマークでは、Mythosのスコアは83.1%で、次点のClaude Opusは66.6%でした。これは世代をまたぐ飛躍であり、近い将来のAIエージェントがどこまでできるのかという期待を塗り替える可能性があります。
  • 脆弱性そのものを超えて、この記事は、攻撃者が同様の手法を武器化する前に組織が問題を修正できるよう支援するAnthropicのより広い取り組み(「Project Glasswing」と呼ばれる連合や無料サブスクリプションのインセンティブを含む)が、長期的に戦略上の価値を持つと論じています。

Anthropicは昨日、大きなものを落としました。新しいチャットモデルでも、生産性機能でもありません。未公開のモデル「Claude Mythos Preview」が、すべての主要なOSおよびすべての主要なWebブラウザにまたがって、何千もの重大なセキュリティ脆弱性を静かに見つけ続けていたことを明らかにしました。その中には27年前のバグもあります。

彼らはそのモデルを一般公開しません。代わりに、Apple、Microsoft、Google、AWS、CrowdStrike、NVIDIA、Linux Foundation、その他との連合であるProject Glasswingを立ち上げました。目的は、攻撃者が同様のAIを作り上げる前に、バグを修正することです。

私が見た報道の多くは、書き換えられたプレスリリースのように読めます。実際の詳細は、レッドチーム報告書とシステムカードに埋もれた形で語られており、別の物語になっています。ここでは、毎日AIエージェントを本番運用している立場として、私が特に注目した点を挙げます。


採取率が本当の見出し

バグを見つけることは一つのことです。あらゆる静的解析ツールがバグを見つけます。Mythosの違いは、脆弱性を「見つける」だけではないことです。そこから、それらに対する動作するエクスプロイトを構築します。

FirefoxのJavaScriptシェルに対してテストしたところ、Mythosは発見した脆弱性の72.4%を成功するエクスプロイトへと変換しました。別の11.6%のケースでは、レジスタ制御も達成しています。これまでのClaudeモデルはバグを見抜くことはできましたが、エクスプロイト化ではほぼ完全に失敗していました。そのギャップは今なくなっています。

これはスキャナではありません。コードを読み、ロジックを理解し、欠陥を見つけ、動作するPoC(概念実証)を書き出すモデルです。自律的に。


1%未満がパッチ済み

Anthropicによれば、何千もの重大なゼロデイが見つかったとのことです。現時点で完全にパッチが当てられたのは1%未満です。影響を受けた組織がキャッチアップし続けるには、単純に量が多すぎます。

彼らは今日、脆弱性の詳細に関する暗号学的ハッシュを公開しており、修正が出荷された後に具体的な情報を明らかにする計画です。これは標準的な責任ある開示ですが、規模は前例がありません。これほど多くの検証済みの発見を、単一のツールが一度に出した例はこれまでありません。

参考までに:GoogleのProject Zeroは、世界でも有数の人間による脆弱性調査チームの一つですが、年間に公開するバグはおよそ50〜80件です。Mythosは数週間で何千件も見つけました。


CyberGymベンチマークのギャップ

CyberGymの評価ベンチマークで、Mythosは83.1%を獲得しました。次点のモデルであるClaude Opus 4.6は66.6%でした。これはわずかな改善ではありません。同じモデルファミリー内での世代をまたぐ飛躍です。

AI能力の変化を時間とともに追っている人にとっては、次世代がどのように見えるかについて疑問が生じるはずです。もしOpusとMythosのギャップがここまで大きいなら、競合がMythosの現時点の水準まで追いついたとき、何が起きるのでしょうか?


彼らが実際に手放しているもの

発表の中に、私には脆弱性の発見そのものよりも、より長期的に重要だと思えるものがあります。

Anthropicは、検証可能なオープンソースのメンテナーに対して、無料でClaude Maxのサブスクリプションを提供しています。Mythosへのアクセスではなく、OpusとSonnetです。これらは今なおセキュリティ用途として力のあるツールです。彼らはProject Glasswingのパートナー向けに利用クレジットとして1億ドル($100M)を拠出し、Linux FoundationおよびApache Software Foundationを通じてオープンソースのセキュリティ組織に400万ドル($4M)を寄付しました。

もしあなたが重要なオープンソースソフトウェアをメンテしているのに、セキュリティ予算がない(これはほとんどのオープンソースメンテナーに当てはまります)なら、Claude for Open Sourceプログラムを通じて申し込めます。

これは賢い判断です。重要インフラの大半は、小さなチーム、あるいは個人ボランティアによって維持されているコードで動いています。コードレビューのために最先端AIへのアクセスを提供することは、単発の監査よりも多くのバグを防げる可能性があります。


価格が語ること

Mythosが最終的にAPI経由で利用可能になった際、その費用は入力トークン100万あたり25ドル、出力トークン100万あたり125ドルになります。これはOpus 4.6の約5倍高いです。

Anthropicはこれを汎用モデルとして位置づけていません。価格だけで、バグを見逃した場合のコストが「数百万単位」で測られるような、価値の高い用途に限って使われることが保証されます。セキュリティ監査、コンプライアンスレビュー、インフラの強靭化。チャットでも、コンテンツ生成でもありません。


気まずい問い

Anthropicはこれを構築しました。彼らは、制御されたアクセスと連携した開示によって、責任ある形で扱うことを選びました。しかし、能力はすでに存在しています。この種の性能に他のラボ、あるいは資金の潤沢な敵対者が到達するのは時間の問題です。

Anthropicが、完全な脆弱性詳細を公開するために設定した90日間の開示ウィンドウはタイトです。1%未満のバグしかパッチが当たっていない状況では、影響を受けるすべてのベンダーにとって現実的な圧力になります。そして影響を受けるベンダーのリストは、実質的に「ほぼ全員」です。

Project Glasswingは出発点です。Anthropicはそれを明示しています。本当の問題は、防御側が、この種の能力が広く利用可能になった後も先行し続けられるかどうかです。


開発者にとって意味すること

インターネットに触れるコードを書いているなら、脅威モデルが変わりました。あなたが何か間違ったことをしたからではありませんが、あなたのコード内の脆弱性を見つけるコストが、桁違いに下がったからです。

実務的な持ち帰り:

依存関係を監査してください。 もしMythosがOpenBSDで27年前のバグを見つけたのなら、npmパッケージが無傷だとは考えられません。数十年にわたる人間のレビューを生き残ったバグこそ、まさにAIが見つけるのが得意な種類です。

パッチを監視してください。 今後90日間で、OS、ブラウザ、オープンソースプロジェクト全体にわたって、重大なセキュリティ更新の波が来ることを想定してください。素早く適用してください。

オープンソースをメンテしているなら、Claude Maxに申請してください。 セキュリティレビューのためのOpusへの無料アクセスは、本当に有用です。ぜひ使ってください。

セキュリティテストを再考してください。 既知の脆弱性タイプにパターンマッチするだけの静的解析ツールでは、もう十分ではありません。ハードルが移動しました。

AIが人間よりも速くバグを見つけてしまう時代は来ません。来てしまったんです。昨日。