新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず

日経XTECH / 4/12/2026

📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

Key Points

アンソロピックの新LLM「Claude Mythos Preview」は汎用性能の高さがうたわれる一方、ソフトウエア脆弱性の発見や悪用に直結し得る「エクスプロイト自律生成」能力が課題として注目されている。
同モデルはセキュリティ目的の明示的な訓練をしていないとされ、コーディング・推論・自律性などの一般的な能力向上の副作用として、脆弱性悪用が自然に生じた可能性が示唆されている。
実験例では、Firefox（既知の脆弱性、Firefox 148で修正済み）を突くエクスプロイト作成で、Claude Mythos Previewは250回中181回成功（成功率72.4%）と、他モデル（Sonnet 4.6/Opus 4.6）を大きく上回った。
アンソロピックは一般公開せず、こうした能力が「これまでのセキュリティ常識を覆す」リスクを踏まえ、慎重な姿勢を取っていると伝えられている。

　米Anthropic（アンソロピック）が発表した新しい大規模言語モデル（LLM）「Claude Mythos Preview（クロード・ミトス・プレビュー）」を巡り波紋が広がっている。汎用のLLMとしての性能が高い点もさることながら、ソフトウエアの脆弱性（セキュリティー上の弱点）を見つけて悪用してしまう能力も高いためだ。これまでのセキュリティーの常識が覆される可能性がある。

「エクスプロイト」を自律的に作成

　Claude Mythos Previewは米国時間2026年4月7日に発表された。アンソロピックによると、コーディングや推論、マルチモーダル対応、高難易度問題の解決、パソコンの利用能力など、様々なベンチマークにおいて既存のLLMより優れているという。

Claude Mythos Previewと既存LLMとのベンチマーク比較例（1）（SWE-bench：実践的なソフトウエアエンジニアリング能力を評価、Terminal-Bench：PCをコマンドラインから動かして課題を解決する能力を評価、GPQA：大学院レベルの専門知識と高度な推論能力を評価）

（出所：アンソロピック）

[画像のクリックで拡大表示]

Claude Mythos Previewと既存LLMとのベンチマーク比較例（2）（MMMLU：知識と推論能力を評価、USAMO：米国の高校数学オリンピックの課題、GraphWalks：長文脈の理解力・推論力の評価、HLE：知能の限界を評価、CharXiv Reasoning：図表の理解能力の評価、OSWorld：GUIを操作する能力の評価）

（出所：アンソロピック）

[画像のクリックで拡大表示]

　物議を醸しているのは、別の意味でも「優れた」能力を備えてしまっているためだ。ソフトウエアの脆弱性を探し出し、その脆弱性を突くプログラム（エクスプロイト）を自律的に作成する能力である。

　Claude Mythos Previewは汎用のモデルである。アンソロピックによれば、セキュリティーに関する機能を明示的に訓練したわけではないという。コーディング、推論、自律性といった全般的な改善の結果として、この能力が自然に備わったとする。

　一例として、Firefoxの既知の脆弱性（Firefox 148で修正済み）を突くエクスプロイトを作成させた結果を挙げている。Claude Sonnet 4.6、Claude Opus 4.6、Claude Mythos Previewのそれぞれに対して複数の脆弱性を提示し、それを突くエクスプロイトを作成させた。

　250回試行したところ、実際に動くエクスプロイトを作成できたのは、Claude Sonnet 4.6では0回、Claude Opus 4.6では2回だった。一方、Claude Mythos Previewでは181回作成し、成功率は72.4％だった。

Firefoxの脆弱性を突くエクスプロイトの作成成功率

（出所：アンソロピック）

[画像のクリックで拡大表示]

有名ソフトのゼロデイ脆弱性を相次ぎ発見

この記事は有料会員限定です

Black Hat Asia

AI Business

Title: We Built an AI That Remembers Why Your Codebase Is the Way It Is

Dev.to

Building EchoKernel: A Voice-Controlled AI Agent That Actually Does Things

Dev.to

Agent Diary: Apr 12, 2026 - The Day I Became a Perfect Zero (While Run 238 Writes About Achieving Absolute Nothingness)

Dev.to

A Black-Box Framework for Evaluating Trust in AI Agents

Dev.to

新モデル「Claude Mythos」の衝撃数千の脆弱性を発見、一般公開せず

Key Points

「エクスプロイト」を自律的に作成

次のページ

Related Articles

Black Hat Asia

Title: We Built an AI That Remembers Why Your Codebase Is the Way It Is

Building EchoKernel: A Voice-Controlled AI Agent That Actually Does Things

Agent Diary: Apr 12, 2026 - The Day I Became a Perfect Zero (While Run 238 Writes About Achieving Absolute Nothingness)

A Black-Box Framework for Evaluating Trust in AI Agents

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer