Project Glasswing
AI時代に向けた重要ソフトウェアの確保
続きを読むはじめに
本日、Project Glasswing1 を発表します。これは、Amazon Web Services、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks が一堂に会し、世界で最も重要なソフトウェアを確保するための取り組みです。
私たちが Project Glasswing を立ち上げたのは、Anthropic が訓練した新たなフロンティアモデルにおいて、新たな局面で確認された能力が、サイバーセキュリティを一変させ得ると考えたからです。Claude Mythos2 Preview は、汎用の、まだリリースされていないフロンティアモデルであり、厳然たる事実を明らかにしています。つまり、AIモデルは、ソフトウェアの脆弱性を見つけて悪用することにおいて、最も熟練した人間を除くほぼ全てを上回れるレベルのコーディング能力に到達しているのです。
Mythos Preview はすでに、あらゆる主要なオペレーティングシステムおよびWebブラウザ に含まれるものを含む、数千件の高い重大度の脆弱性を見つけています。AI の進歩の速度を考えると、このような能力が、これらを安全に配備することに専念する主体の外側まで拡散するのも、そう遠くはありません。経済、公衆の安全、国家安全保障への影響は深刻になり得ます。Project Glasswing は、こうした能力を、防御目的のために活用するための急を要する試みです。
Project Glasswing の一環として、上記に挙げたローンチパートナー各社は、防御的なセキュリティ業務の中で Mythos Preview を活用します。Anthropic は、学んだことを共有し、業界全体が恩恵を受けられるようにします。また、重要なソフトウェア基盤を構築または維持している 40 を超える追加の組織のグループへのアクセスも拡張し、同モデルを使って、第一者のシステムとオープンソースのシステムの両方をスキャンし防御できるようにします。これらの取り組みにおいて、Anthropic は Mythos Preview の利用クレジットとして最大 1 億ドルを拠出し、さらにオープンソースのセキュリティ組織への直接寄付として 400 万ドルを拠出します。
Project Glasswing は出発点です。これらのサイバーセキュリティ課題を、単独の組織だけで解決できる者はいません。フロンティアAIの開発者、他のソフトウェア企業、セキュリティ研究者、オープンソースの保守担当者、そして世界各国の政府が、それぞれ欠かせない役割を担っています。世界のサイバー基盤を防御する取り組みには数年かかる可能性がありますが、フロンティアAIの能力は、ほんの数か月のうちにも大幅に前進していくでしょう。サイバー防御側が優位に立つためには、今すぐ行動する必要があります。

AI時代のサイバーセキュリティ
私たち全員が日々頼りにしているソフトウェア――銀行のシステムを稼働させること、医療記録を保管すること、物流ネットワークをつなぎ合わせること、電力グリッドが機能し続けるようにすること、そしてそれ以外にもさまざまなこと――には、これまでも常にバグが含まれてきました。軽微なものも多いですが、中には重大なセキュリティ上の欠陥もあり、それが見つかれば、サイバー攻撃者がシステムを乗っ取ったり、業務を妨害したり、データを盗んだりできる可能性があります。
私たちはすでに、サイバー攻撃が重要な企業ネットワーク、医療システム、エネルギーのインフラ、交通の拠点、および政府機関を含む世界中の情報セキュリティに与えた深刻な影響を目にしてきました。世界の舞台では、中国、イラン、北朝鮮、ロシアといった主体による国家支援の攻撃が、市民生活と軍の即応態勢の両方を支える基盤インフラを損なう、あるいはその機能を危うくすることで脅威を与えてきました。個別の病院や学校が標的にされるような、より小規模な攻撃であっても、依然として重大な経済的損害をもたらし、機微なデータを露出させ、さらには人命を危険にさらすことがあります。サイバー犯罪の現在の世界的な金銭的コストを正確に見積もるのは難しいものの、毎年およそ5,000億ドル($500B)に及ぶ可能性があります。
ソフトウェアの多くの欠陥は、特定して悪用するにはごく一部の熟練したセキュリティ専門家が持つ専門性が必要だったため、何年も見過ごされてきました。しかし、最新の最先端AIモデルによって、ソフトウェアの脆弱性を見つけ、悪用するために必要なコスト、労力、そして専門性のレベルは、いずれも大幅に低下しました。過去1年の間に、AIモデルはコードを読み取り、推論する能力を着実に高めており、とりわけ脆弱性を見つけ出し、それを悪用する方法を組み立てるという、注目に値する能力を示しています。Claude Mythos Previewは、こうしたサイバー分野の技能における飛躍を示しています。モデルが見つけた脆弱性の中には、あるケースでは、人間による何十年にもわたるレビューや、何百万件もの自動化されたセキュリティテストを経てもなお残っていたものがあり、またモデルが開発するエクスプロイトは、ますます高度になっています。
最初のDARPAサイバー・グランド・チャレンジから10年が経ち、いま最先端のAIモデルは、脆弱性を見つけて悪用する分野で、最高の人間と競り合えるまでになってきています。必要なセーフガードがなければ、こうした強力なサイバー能力は、世界の最重要ソフトウェアに存在する数多くの既存の欠陥を悪用するために使われてしまう可能性があります。これは、あらゆる種類のサイバー攻撃をより頻繁に、より破壊的にするおそれがあり、また米国および同盟国の対抗者に力を与えることにもつながります。したがって、これらの課題への取り組みは、民主主義国にとって重要なセキュリティ優先事項です。
AIによって強化されたサイバー攻撃がもたらすリスクは深刻ですが、楽観できる理由もあります。AIモデルを誤った相手にとって危険にするのと同じ能力が、重要なソフトウェアの欠陥を見つけて修正するうえではかけがえのないものとなり、さらにセキュリティ上のバグをはるかに少なくした新しいソフトウェアを作り出すことにも役立つのです。Project Glasswingは、今後のAI主導のサイバーセキュリティ時代において、防御側が揺るぎない優位性を持つための重要な一歩です。

Claude Mythos Previewで脆弱性とエクスプロイトを特定する
ここ数週間、私たちはClaude Mythos Previewを使用して、数千件のゼロデイ脆弱性(すなわち、ソフトウェアの開発者がそれまで知らなかった欠陥)を特定してきました。その多くは重大なもので、あらゆる主要なオペレーティングシステムおよびあらゆる主要なWebブラウザに加え、ほかにも重要なさまざまなソフトウェアに対して行いました。
Frontier Red Team blogの投稿では、すでにパッチが適用されたこれらの脆弱性の一部について技術的な詳細を紹介し、場合によってはMythos Previewがそれらを悪用する方法をどのように見つけたかも説明します。Mythos Previewは、人による誘導なしに、これらの脆弱性のほぼすべてを特定し、関連するエクスプロイトを多数開発することができました。以下は3つの例です:
- Mythos Previewは、OpenBSDの27年前の脆弱性を発見しました。OpenBSDは、世界でもっともセキュリティ強化が進んだオペレーティングシステムの1つとしての評判があり、ファイアウォールやその他の重要なインフラを動かすために使用されています。この脆弱性により、攻撃者はそれに接続するだけで、同オペレーティングシステムを実行している任意のマシンをリモートからクラッシュさせることが可能でした;
- また、Mythos Previewは、FFmpegの16年前の脆弱性も見つけました。FFmpegは、数え切れないほど多くのソフトウェアで動画のエンコードとデコードに使用されています。この脆弱性は、テスト自動化ツールが問題を一度も検知できないまま500万回以上ヒットしていた1行のコードの中にありました;
- モデルは自律的に、Linuxカーネル(世界のサーバのほとんどを動かしているソフトウェア)内の複数の脆弱性を見つけて連鎖させ、攻撃者が通常のユーザー権限からマシン全体の完全な制御へと権限を昇格できるようにしました。
上記の脆弱性は、関係するソフトウェアの保守担当者に報告しており、いずれも現在パッチが適用済みです。その他の多くの脆弱性については、今日、詳細の暗号学的ハッシュを提供しています(Red Team blogを参照)。修正が適用された後、具体的な内容を公開します。
CyberGymのような評価ベンチマークは、Mythos Previewと私たちの次点モデルであるClaude Opus 4.6の間に、大きな差があることを裏付けています:
サイバーセキュリティの脆弱性の再現
CyberGym
私たち自身の取り組みに加えて、多くのパートナー企業もすでに数週間にわたりClaude Mythos Previewを使用しています。彼らが見つけた内容は次のとおりです:
“AIの能力が、重要インフラをサイバー脅威から守るために必要な緊急性を根本的に変える段階を越えました。そして、後戻りはできません。これらのモデルに関する基盤作業によって、これまで不可能だった速度と規模で、ハードウェアとソフトウェア全体にわたるセキュリティ脆弱性を特定し、修正できることがわかりました。これは大きな変化であり、従来のシステム強化のやり方ではもはや十分ではないという明確なシグナルです。
テクノロジーの提供企業は、今すぐ新しいアプローチを積極的に取り入れる必要があり、顧客側もそれを展開できる準備が必要です。だからこそCiscoはProject Glasswingに参加しました—この取り組みは、ひとりで行うには重要すぎて、緊急性が高すぎます。”
Anthony Grieco
CiscoのSVP & Chief Security & Trust Officer
“AWSでは、脅威が現れる前に防御を構築します。独自のシリコンからテクノロジースタック全体にわたってです。セキュリティは私たちにとって“フェーズ”ではありません。私たちが行うすべてに継続的に組み込まれています。私たちのチームは脅威のために、毎日400兆を超えるネットワークフローを分析しており、AIは、規模を大きくして守るための私たちの能力の中核です。
私たちは自社のセキュリティ運用において、Claude Mythos Previewをテストし、重要なコードベースに適用してきました。すでにそれが私たちのコードを強化するのに役立っています。Anthropicとのパートナーシップに対して、深いセキュリティの専門知識をもたらし、Claude Mythos Previewをさらに強化することで、より多くの組織が、基準となるセキュリティとともに、最も野心的な取り組みを前進させられるよう支援しています。”
Amy Herzog
Amazon Web ServicesのVice President and CISO
“サイバーセキュリティが、純粋に人間の能力だけに制約されるものではなくなるフェーズに入るいま、AIを責任ある形で活用して、セキュリティを改善し、リスクを大規模に低減するという機会は、前例のないものです。Claude Mythos PreviewへのアクセスがあるProject Glasswingに参加することで、リスクを早期に特定し、軽減できるようになります。また、セキュリティと開発ソリューションを強化して、顧客およびMicrosoftをより適切に守れるようにしていきます。
オープンソースのセキュリティベンチマークであるCTI-REALMに対してテストしたところ、Claude Mythos Previewは、これまでのモデルと比べて大幅な改善が見られました。私たちはAnthropicおよび業界全体と提携し、すべての人にとってセキュリティの成果を高めていくことを楽しみにしています。”
Igor Tsyganskiy
EVP of Cybersecurity and Microsoft Research, Microsoft
“脆弱性が発見されてから、攻撃者に悪用されるまでの時間的な猶予が崩れました。これまで数か月かかっていたことが、AIによって今では数分で起きるのです。
Claude Mythos Previewは、大規模な規模で防御側に今可能になりつつあることを示しています。そして、攻撃者は必ず同じ能力を悪用しようとします。だからといってスピードを落とすべき理由にはなりません。むしろ一緒に、より速く前進すべきだということです。AIを導入するなら、セキュリティが必要です。だからこそCrowdStrikeは初日から、この取り組みに加わっています。”
Elia Zaitsev
Chief Technology Officer, CrowdStrike
“これまで、セキュリティの専門知識は、大規模なセキュリティチームを抱える組織だけが持つ贅沢品でした。オープンソースのメンテナー—世界の重要なインフラの多くを支えている彼ら—は、これまでセキュリティを自分たちで何とかするしかなかったのが実情です。オープンソースソフトウェアは、現代のシステムにおけるコードの大部分を占めています。そこには、まさにAIエージェントが新しいソフトウェアを書くために使うシステムも含まれます。
これらの重要なオープンソースコードベースのメンテナーに対して、大規模な規模で脆弱性を事前に特定し、修正できる新世代のAIモデルへのアクセスを提供することで、Project Glasswingは、その方程式を変えるための現実的な道筋を提示します。こうして、AIによって強化されたセキュリティが、費用のかかるセキュリティチームを確保できる一部の人だけのものではなく、すべてのメンテナーにとって信頼できる“相棒”になり得るのです。”
Jim Zemlin
CEO, The Linux Foundation
「金融システムのサイバーセキュリティとレジリエンスを推進することは、JPMorganChaseのミッションの中核であり、共有された課題に対して主導的な機関が協働することで、業界は最も強くなると私たちは考えています。Project Glasswingは、重大なインフラにおける防御的サイバーセキュリティのための次世代AIツールを、私たち自身の条件で、また尊敬される技術リーダーと並行して評価できる、独自の初期段階の機会を提供します。 私たちは、どのように進めるべきか、そしてどのように支援できるのかを判断するにあたり、厳格で独立したアプローチを取ります。Anthropicの取り組みは、この瞬間に求められる種類の、先を見据えた協力的な姿勢を反映しています。」
Pat Opet
JPMorganChase チーフ情報セキュリティ責任者
「Googleは、この業界横断のサイバーセキュリティの取り組みが結集し、Vertex AIを通じて参加者にMythos Previewを提供できることをうれしく思います。業界が、ポスト量子暗号、責任あるゼロデイの開示、セキュアなオープンソースソフトウェア、AIベースの攻撃への防御など、いずれの新たなセキュリティ課題についても協力することが常に重要でした。 私たちは長く、AIが新たな課題をもたらし、サイバー防御に新しい機会を開くと考えてきました。そのため、Big SleepやCodeMenderのような、AIを活用したツールを構築し、重要なソフトウェアの欠陥を見つけて修正できるようにしてきました。私たちは、最先端のサイバーセキュリティ・プラットフォームへの投資を継続し、ユーザー、顧客、エコシステム、そして国家安全保障を守ることに焦点を当てた文化を育んでいきます。」
Heather Adkins
Google セキュリティエンジニアリング担当VP
「ここ数週間で、私たちはClaude Mythos Previewモデルにアクセスし、それを使って、これまでの世代のモデルでは完全に見落としていた複雑な脆弱性を特定しました。これは、これまで隠れていた脆弱性を見つけるためのゲームチェンジャーであるだけでなく、攻撃者がこれまで以上に多くのゼロデイ脆弱性を見つけ、これまで以上に速い速度でエクスプロイトを開発できるようになるという危険な転換を示しています。 これらのモデルは、攻撃者がアクセスする前に、誰もがオープンソースの所有者と防御側の担い手として手に取り、これらの脆弱性を見つけて修正する必要があるのは明らかです。さらに重要なのは、誰もがAI支援型の攻撃者に備える必要があるということです。攻撃は増え、攻撃はより速くなり、攻撃はより巧妙になるでしょう。今こそ、あらゆる場所でサイバーセキュリティのスタックを最新化する時です。防御を最優先することができるよう、これらの強力な機能が業界と連携して実現されるようにするために、Anthropicがパートナーシップを組んだことを称賛します。」
Lee Klarich
Palo Alto Networks チーフプロダクト&テクノロジーオフィサー
Claude Mythos Previewの強力なサイバー機能は、その優れたエージェント的なコーディング能力と推論能力の賜物です。たとえば、以下に示す評価結果では、モデルはさまざまなソフトウェアのコーディング課題において、これまでに開発されたどのモデルよりも最高スコアを記録しています。
SWE-bench Pro
Terminal-Bench 2.0
SWE-bench マルチモーダル(内部実装)
SWE-bench 多言語
SWE-bench Verified
• SWE-bench Verified, Pro, and Multilingual:私たちの暗記(memorization)検出用の画面は、これらのSWE-bench評価における問題の一部をフラグ付けします。暗記の兆候が見られる問題を除外すると、Mythos PreviewのOpus 4.6に対する改善の余地(margin of improvement)は維持されます。 • SWE-bench Multimodal:Mythos PreviewとOpus 4.6の両方に対して社内実装を使用しました。公開リーダーボードのスコアとは直接比較できません。 • Terminal-Bench 2.0:各タスクについて、最大限の労力で適応的に推論するTerminus-2ハーネスを使用し、総タスク予算を100万トークンとしました。すべての実験では、タスクごとに5回の試行で平均を取り、保証される資源配分(1×)/上限までの資源配分(3×)を用いました。タイムアウト上限を4時間に増やし、Terminal-Bench 2.1の更新を使用したところ、Mythos Previewは92.1%のスコアを獲得しました。
GPQA Diamond
Humanity’s Last Exam
Humanity’s Last Exam:Mythosは、低い労力(low effort)でもHLEで依然として良好に動作することを確認しました。これは、何らかの暗記(memorization)が行われている可能性を示唆しているかもしれません。
BrowseComp
OSWorld-Verified
BrowseComp: Claude Mythos Preview は Opus 4.6 よりも高いプレビュー スコアを示しつつ、使用するトークン数は 4.9× 少なくなります。
モデルの能力、安全特性、一般的な特性に関する詳細は、Claude Mythos Preview system card をご覧ください。
私たちは Claude Mythos Preview を一般提供する予定はありませんが、最終的には、Mythos クラスのモデルを大規模に、安全に展開できるようにすることが私たちの目標です—サイバーセキュリティ目的だけでなく、そうした非常に高い能力を持つモデルがもたらす無数のその他の利点のためでもあります。そのためには、モデルの最も危険な出力を検出し、ブロックするサイバーセキュリティ(およびその他の)セーフガードの開発を前進させる必要があります。私たちは、近々登場する Claude Opus モデルで新しいセーフガードを立ち上げ、Mythos Preview3 と同じレベルのリスクをもたらさないモデルを用いて、それらを改善し洗練させることを計画しています。

Project Glasswing の計画
今回の発表は、より長期的な取り組みの始まりです。成功させるには、テクノロジー業界全体をはじめとする幅広い関与が必要になります。
Project Glasswing のパートナーは、基盤システムにおける脆弱性や弱点を見つけて修正するために、Claude Mythos Preview へのアクセスを受け取ります。これらのシステムは、世界に共有されたサイバー攻撃面の非常に大きな部分を占めるものです。この取り組みは、ローカルな脆弱性検出、バイナリのブラックボックス テスト、エンドポイントの防護、システムへのペネトレーションテストなどの作業に重点が置かれると見込んでいます。
Project Glasswing と追加の参加者に対する、モデル利用クレジットとしての Anthropic の 100M ドルの拠出は、この研究プレビュー期間中の多大な利用をカバーします。 その後、Claude Mythos Preview は、入力/出力トークン 100 万あたり 25 ドル / 125 ドルで、参加者が利用できるようになります(参加者は Claude API、Amazon Bedrock、Google Cloud の Vertex AI、および Microsoft Foundry でモデルにアクセスできます)。
モデル利用クレジットの拠出に加えて、Linux Foundation を通じて Alpha-Omega および OpenSSF に 250 万ドルを寄付し、また、オープンソース ソフトウェアのメンテナーがこの変化する状況に対応できるようにするため、Apache Software Foundation に 150 万ドルを寄付しました(アクセスに関心のあるメンテナーは、Claude for Open Source プログラムを通じて申請できます)。
私たちは、この取り組みの対象範囲を広げ、何か月にもわたって継続していく意向です。そして、他の組織が自組織のセキュリティに同様の教訓を適用できるように、可能な限り共有していきます。パートナーは、可能な範囲で互いに情報やベストプラクティスを共有します。90 日以内に、Anthropic は、私たちが学んだことに加えて、開示可能な範囲で修正した脆弱性や改善内容について、公開レポートを行います。また、AI 時代においてセキュリティ実践がどのように進化すべきかに関する一連の実践的な推奨事項を作成するため、主要なセキュリティ組織とも協力します。これには、潜在的に次のようなものが含まれ得ます:
- 脆弱性開示プロセス;
- ソフトウェア更新プロセス;
- オープンソースおよびサプライチェーンのセキュリティ;
- ソフトウェア開発ライフサイクルと、secure-by-design の実践;
- 規制対象の業界向けの標準;
- トリアージのスケーリングと自動化;および
- パッチ適用の自動化。
Anthropic はまた、Claude Mythos Preview と、その攻撃・防御のサイバー能力について、米国政府の関係者と継続的に協議を行ってきました。先ほど述べたとおり、重要インフラの防護は民主主義国にとって最優先の国家安全保障事項です。こうしたサイバー能力の出現は、米国とその同盟国が AI 技術において決定的な優位性を維持しなければならない、もう一つの理由でもあります。政府には、その優位性の維持に向けて、また AI モデルに関連する国家安全保障上のリスクの評価と軽減の両面で、不可欠な役割があります。私たちは、これらの業務を支援するために、地方・州・連邦の代表者と協力する準備ができています。
私たちは、Project Glasswing が産業界および公共部門にまたがるより大規模な取り組みの種をまけることを期待しています。そこでは、強力なモデルがセキュリティに与える影響に関する最重要の問いに取り組むために、あらゆる関係者が協力することになります。私たちは、他の AI 業界のメンバーにも、業界の標準づくりにおいて私たちと共に参加していただきたいと考えています。中期的には、民間と公共の組織をまとめることができる独立した第三者機関—そのような組織—が、これらの大規模なサイバーセキュリティ プロジェクトを継続して進めるのに理想的な拠り所になるかもしれません。
付録
- このプロジェクトはガラスウイング(glasswing)アゲハチョウにちなんで命名されており、Greta oto です。この比喩は、2 つの方法で適用できます。チョウの透明な翅によって、私たちがこの投稿で議論しているような脆弱性と同様に、目立たない場所に潜みやすくなるためです。また、その翅は、私たちがアプローチで提唱している「透明性」のように、害を免れることも可能にします。
- 古代ギリシャ語の「発話」または「物語(narrative)」に由来します。文明が世界を理解するために用いた「物語の体系」のことです。
- これらのセーフガードによって正当な業務が影響を受けるセキュリティ専門家は、今後予定されている Cyber Verification Program に応募できるようになります。




