共有:

Cross-Vendor Safety

脱獄対策で、
4社が同じ表に座る。

Anthropic が Amazon・Microsoft・Google と組み、生成AIの「脱獄」への共通対策フレームワークを提案します。競合が同じベンチで守る側に回るのは、5/26 の Project Glasswing に続く2度目——静かに、安全対策の"仕入先"の共有が始まります。

AI Navigate 編集部2026.07.02読了 6分

SHARED DEFENSE LAYER ANTHROPIC AMAZON MICROSOFT GOOGLE COMMON JAILBREAK BENCHMARKS · SHARED PATCHES 同じ攻撃サンプル・同じスコア・同じ守り方
01

The Baseline

「守り方」は、
各社バラバラだった

これまで、生成AIの脱獄——モデルに禁止事項を破らせる誘導プロンプト——への対策は、各社が独自に社内で回してきました。攻撃サンプル、評価スコア、修正手順、いずれも表に出ないまま、それぞれの評価環境で処理されるのが常態でした。

結果、A社で通用しないプロンプトが B社で通ってしまう、修正が反映されるまでの時間差で被害が広がる、という穴があちこちに残っていました。攻撃側の情報共有は速いのに、守る側は分断されている——これが、脱獄に長らく効かなかった一番の理由です。


02

The Framework

共通ベンチと、
共通パッチ

今回の枠組みは、その分断を"共通表"で埋めにいきます。

ATTACK SAMPLES SHARED BENCHMARK Ant. Amz. Msft. Goog. Score Patch FIXES · ALL VENDORS
FIG. 攻撃サンプル→共通ベンチマーク→全社への修正配布、を一つの経路にする

Anthropic が Amazon・Microsoft・Google と共同で、ジェイルブレイク対策のフレームワークを策定すると発表しました。同じ攻撃サンプル群を、同じ評価軸で採点し、修正パッチも各社に配布する——という、これまで社内に閉じていた工程を、4社の共有レイヤーに引き上げる構想です。

単発の共同宣言で終わらせないため、共通のベンチマークデータセットと、脆弱性の報告→修正の SLA を含む運用ガイドラインが同時に発表されました。「宣言だけ」で終わりがちなこの領域で、実装まで並べたのは注目に値します。

03

Second Move

Glasswing に続く
2度目の連携

4社
Anthropic・Amazon・Microsoft・Google
2度目
5/26 Glasswing に続く多社連携
共通
ベンチマーク・SLA・修正配布

5/26 の Project Glasswing は、Anthropic を含む12組織のサイバー防御コンソーシアムでした。今回はその流れの延長で、対象を「サイバー攻撃全般」から「ジェイルブレイク」に絞った第2弾——という位置づけです。

Glasswing が"守る側の合流点"を作ったのに対し、今回のフレームワークは"守る側の共通言語"を作りにいく試みです。ベンダー横断で同じ数字が並ぶ、というだけで、経営や監査の会話が一気に整理されます。

04

Who Feels It

効くのは、
ベンダー選定の現場

企業のセキュリティ担当

脱獄耐性のスコアがベンダー間で比較できるようになります。監査対応で"横並びの数字"を求められる場面で刺さります。

調達・法務

「安全対策の水準」を条項に落とし込める根拠が増えます。SLA として書ける実運用の要件ができました。

個人ユーザー

直接の体感差はほぼありません。ただし炎上する脱獄事例が減れば、間接的にサービス側の安定に寄与します。


05

The Frontier

競合が、
同じベンチで座る意味

安全対策が競争軸から外れるわけではありません。しかし、脆弱性の可視化と修正配布までを共通化することで、"攻撃側だけが情報を共有していた" 非対称は縮みます。競争のレイヤーが、"どう守るか" から "どこまで先回りできるか" へと少し上に上がる——この移動は、業界全体にとってはっきり良い方向です。

もちろん、4社の中で誰かが独占的な地位を得ようとすれば、この共通表はあっさり形骸化します。それでも、こう座らせただけで一段前進です。ジェイルブレイクの現場を知る立場からすれば、"座らせる" こと自体が難題だったからです。

情報元: anthropic.com · AI Navigate — Daily Update · 2026.07.02