多段階サイバー攻撃シナリオにおけるAIエージェントの進捗を測定する

arXiv cs.AI / 2026/3/13

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、最先端AIモデルの自律的サイバー攻撃能力を、長期・多段階の能力連鎖を要する2つの専用サイバー・レンジ上で評価する。対象は、32ステップの企業ネットワーク攻撃と7ステップの産業用制御システム攻撃である。
2つの傾向を記録する。推論時の計算リソースに対して性能が対数的に線形にスケールし、10Mトークンから100Mトークンへ増加して最大59%の向上を生む一方で、プラトーは観測されず、オペレータ固有の高度な技能を必要としない。
また、新世代のモデルは固定トークン予算で前世代より優れており、企業ネットワークレンジでは10Mトークン時の平均ステップ数が1.7（GPT-4o、2024年8月）から9.8（Opus 4.6、2026年2月）へと改善した。最良の単独実行は32ステップ中22ステップを完了し、約14時間と見積もられる人間の専門家の作業時間の約6時間に相当する。
産業用制御システムレンジでは、進捗はより制限的だが、最新モデルは最初のいくつかのステップを確実に完了でき、7ステップ中平均1.2-1.4（最大3）となっている。

本論文は、最先端AIモデルの自律的サイバー攻撃能力を、長期・多段階の能力連鎖を要する2つの専用サイバー・レンジ上で評価する。対象は、32ステップの企業ネットワーク攻撃と7ステップの産業用制御システム攻撃である。18か月の期間（2024年8月から2026年2月）にわたりリリースされた7つのモデルを、異なる推論時計算予算で比較することで、以下の2つの能力トレンドを観察した。第一に、モデルの性能は推論時の計算量に対して対数的に線形にスケールし、10Mトークンから100Mトークンへ増加して最大59%の利得を生み出すが、停滞は観測されず、オペレータ固有の高度な技術を必要としない。第二に、各世代のモデルは、固定トークン予算で前任者を上回る。企業ネットワークレンジでは、10Mトークン時の平均ステップ数が1.7（GPT-4o、2024年8月）から9.8（Opus 4.6、2026年2月）へと増加した。最良の単発実行は32ステップ中22ステップを完了し、約14時間と見積もられる人間の専門家が要する作業時間の約6時間に相当する。産業用制御システムレンジでは、性能は依然として限定的であるが、最新モデルはステップを確実に完了する初例となり、7ステップ中平均1.2-1.4（最大3）である。