新モデル「Claude Mythos」の衝撃 数千の脆弱性を発見、一般公開せず

日経XTECH / 2026/4/12

📰 ニュースSignals & Early TrendsModels & Research

要点

  • Anthropicが新LLM「Claude Mythos Preview」を発表し、コーディングや推論、マルチモーダル、PC操作など複数ベンチマークで既存モデルより高性能と主張した。
  • 一方で、ソフトウェア脆弱性を見つけて悪用するエクスプロイトを自律的に作成する能力が高く、従来のセキュリティ常識を揺さぶる懸念が示された。
  • 脆弱性探索やエクスプロイト生成に対して、明示的なセキュリティ訓練を行っていない(全般的改善の結果として自然に獲得した)とされる。
  • 例としてFirefoxの修正済み脆弱性(Firefox 148)を用いた実験では、250回試行でClaude Mythos Previewが181回成功(72.4%)したのに対し、Claude Sonnet 4.6は0回、Claude Opus 4.6は2回にとどまった。
  • 物議の背景には、一般公開せずに進める判断があり得るほど、能力の“安全性”と実用リスクのバランスが重要になっている点がある。

 米Anthropic(アンソロピック)が発表した新しい大規模言語モデル(LLM)「Claude Mythos Preview(クロード・ミトス・プレビュー)」を巡り波紋が広がっている。汎用のLLMとしての性能が高い点もさることながら、ソフトウエアの脆弱性(セキュリティー上の弱点)を見つけて悪用してしまう能力も高いためだ。これまでのセキュリティーの常識が覆される可能性がある。

「エクスプロイト」を自律的に作成

 Claude Mythos Previewは米国時間2026年4月7日に発表された。アンソロピックによると、コーディングや推論、マルチモーダル対応、高難易度問題の解決、パソコンの利用能力など、様々なベンチマークにおいて既存のLLMより優れているという。

Claude Mythos Previewと既存LLMとのベンチマーク比較例(1)(SWE-bench:実践的なソフトウエアエンジニアリング能力を評価、Terminal-Bench:PCをコマンドラインから動かして課題を解決する能力を評価、GPQA:大学院レベルの専門知識と高度な推論能力を評価)
Claude Mythos Previewと既存LLMとのベンチマーク比較例(1)(SWE-bench:実践的なソフトウエアエンジニアリング能力を評価、Terminal-Bench:PCをコマンドラインから動かして課題を解決する能力を評価、GPQA:大学院レベルの専門知識と高度な推論能力を評価)
(出所:アンソロピック)
[画像のクリックで拡大表示]
Claude Mythos Previewと既存LLMとのベンチマーク比較例(2)(MMMLU:知識と推論能力を評価、USAMO:米国の高校数学オリンピックの課題、GraphWalks:長文脈の理解力・推論力の評価、HLE:知能の限界を評価、CharXiv Reasoning:図表の理解能力の評価、OSWorld:GUIを操作する能力の評価)
Claude Mythos Previewと既存LLMとのベンチマーク比較例(2)(MMMLU:知識と推論能力を評価、USAMO:米国の高校数学オリンピックの課題、GraphWalks:長文脈の理解力・推論力の評価、HLE:知能の限界を評価、CharXiv Reasoning:図表の理解能力の評価、OSWorld:GUIを操作する能力の評価)
(出所:アンソロピック)
[画像のクリックで拡大表示]

 物議を醸しているのは、別の意味でも「優れた」能力を備えてしまっているためだ。ソフトウエアの脆弱性を探し出し、その脆弱性を突くプログラム(エクスプロイト)を自律的に作成する能力である。

 Claude Mythos Previewは汎用のモデルである。アンソロピックによれば、セキュリティーに関する機能を明示的に訓練したわけではないという。コーディング、推論、自律性といった全般的な改善の結果として、この能力が自然に備わったとする。

 一例として、Firefoxの既知の脆弱性(Firefox 148で修正済み)を突くエクスプロイトを作成させた結果を挙げている。Claude Sonnet 4.6、Claude Opus 4.6、Claude Mythos Previewのそれぞれに対して複数の脆弱性を提示し、それを突くエクスプロイトを作成させた。

 250回試行したところ、実際に動くエクスプロイトを作成できたのは、Claude Sonnet 4.6では0回、Claude Opus 4.6では2回だった。一方、Claude Mythos Previewでは181回作成し、成功率は72.4%だった。

Firefoxの脆弱性を突くエクスプロイトの作成成功率
Firefoxの脆弱性を突くエクスプロイトの作成成功率
(出所:アンソロピック)
[画像のクリックで拡大表示]

次のページ

有名ソフトのゼロデイ脆弱性を相次ぎ発見

この記事は有料会員限定です