GPT-2からClaude Mythosへ:「公開するには危険すぎる」と見なされたAIモデルの復活

THE DECODER / 2026/4/8

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • OpenAIが約7年前にGPT-2を「危険すぎる」として公開を控えた流れが、今回AnthropicのClaude Mythos Previewでも再現されつつあると報じられています。
  • Claude Mythos Previewでは、OSやブラウザに存在する脆弱性をAIが大量に見つけたという“実証的な材料”が提示されているのがポイントです。
  • その脆弱性の数は非常に多く、しかもAIが生成した結果を人間が十分に精査できない規模であることが強調されています。
  • これまで業界が懐疑的だった「リスク」を、技術的な証拠ベースで改めて提示する形になっていると評価されています。

7年前、OpenAIは言語モデルGPT-2を「公開するには危険すぎる」と宣言しました。業界は冷笑しました。今、AnthropicがClaude Mythos Previewで同じ動きを繰り返しています——しかし今回は、テーブルの上に本当の証拠があります。AIが見つけたもので、人間がほとんどレビューできないほどの、オペレーティングシステムやブラウザに存在する数千もの脆弱性です。

この記事「From GPT-2 to Claude Mythos: The return of AI models deemed 'too dangerous to release'」The Decoderで最初に掲載されました。