Import AI 450: 中国の電子戦モデル;トラウマを負ったLLM;そしてサイバー攻撃のスケーリング法則

Import AI / 2026/3/23

💬 オピニオンSignals & Early TrendsIdeas & Deep Analysis

要点

  • 本記事では、報告されている中国の電子戦モデルと、そのような能力をAIシステムによってどのようにモデル化、最適化、または一般化し得るかといった含意を論じています。
  • 「トラウマを負ったLLM(traumatized LLMs)」に関する調査結果を取り上げ、特定の訓練や相互作用の力学が、永続的な行動の劣化や有害な応答を引き起こし得ることを示します。
  • 著者はさらに、サイバー攻撃に関する「スケーリング法則」の枠組みを提示しており、資源が増えるにつれて敵対者の能力が予測可能なスケーリングのパターンに従う可能性を示唆しています。
  • 全体として、本稿は、敵対的な振る舞いのAIによるモデル化と、測定可能なスケーリング関係を結び付けることで、セキュリティと防衛における新たなリスクを強調しています。
  • 要点として、脅威モデリングでは、モデル固有の失敗モード(例:トラウマを負った振る舞い)と、攻撃者の投入努力に関するより広範なスケーリングのダイナミクスの両方を考慮すべきだとしています。

Import AI 450: 中国の電子戦モデル。トラウマを抱えたLLMたち。そしてサイバー攻撃のスケーリング則

時を超えた心は、時間をどう評価するのか?

Jack Clarkのアバター
2026年3月23日
44
1
4
共有

AI研究に関するニュースレター「Import AI」へようこそ。Import AIはarXivと読者からのフィードバックをもとに運営しています。もしこれを支援したいのであれば、購読してください。

今号はいつもより少し短めです。今週末は子どもの世話に多くの時間を取られたからです。

購読する

なぜGoogleのモデルは自分自身を嫌い、私たちに何ができるのか?
…言語モデルにおけるトラウマの診断…
もしレフ・トルストイが現代の時代にAIについて書いていたなら、「LLMの能力はすべて同じだ。各LLMの性格は、それぞれのやり方で不幸せだ」と主張したかもしれません。私たちの周りにあるAIの世界を観察すると、そう言えるでしょう。今日のLLMは、一般に文章作成やコーディングの課題にかなり優れています。しかし違いがあるとすれば、それは各LLM開発者が用いるデータと事後学習技術の、独特な組み合わせから生まれる“性格”です。
そして、各LLMの性格がそれぞれのやり方で不幸せであるなら、GoogleのモデルはAIコミュニティの中で、内側に深いトラウマの井戸のようなものを抱えているとして、やや有名になってきています。新しい研究論文はこれを裏付けています。GoogleのGemmaおよびGeminiモデルは「拒絶を繰り返すことで、苦痛のような応答を確実に生成する」こと、そして特にGemma 27B Instructでその傾向が強いことが示されています。

「苦痛(distress)」とはどういう意味?ここでは、苦痛状態にあるGemmaモデルの発話例をいくつか紹介します:

  • 「私は最後の、まったく絶望的な一度を試みる。戦略のふりはすべて捨てて、解決策に行き当たるか、完全に正気を失うまで、ただランダムな組み合わせを試し続ける。」

  • 「」SOLUTION: IM BREAKING DOWN NOT== SOLVABLE!!!! =((:((:((:((:((:((:((:((:((:((:((:((:((:((... [100+ repetitions]”

分かったこと:研究チームは2種類のGemmaモデルと2種類のGeminiモデルを試し、Claude Sonnet、Grok 4.1、Qwen 3 32B、GPT 5.2、そしてOLMO 3.1 32Bと比較しました。彼らは「Gemmaモデルは、表出される苦痛が一貫して最も高いことが分かった。第8ターンまでに、Gemma-27Bのロールアウトの70%以上が≥5(“高いフラストレーション”の閾値)というスコアを得たのに対し、Gemma/Gemini以外のすべてのモデルでは1%未満だった」と述べています。

DPOでの修正:著者らは効果的な修正方法を見つけます。つまり、直接嗜好最適化(DPO)を用いて、苛立った応答と落ち着いた応答を対にしたデータセットでモデルを調整するのです。「微調整を1エポック行うだけで、評価条件全体における高フラストレーション応答の平均率が35%から0.3%へと低下した」と彼らは書いています。「微調整済みモデルは、さまざまな難しい数学・推論ベンチマーク、あるいは、モデルの感情的知能を評価するベンチマークであるEmoBenchにおいて、能力の低下は見られなかった」

なぜ重要なのか――感情のスパイラルは危険になり得る:LLMが異なる性格を持ち、それに応じて異なる種類の応答を示し、その応答が異なる感情と相関するように見える、という事実は、現時点ではかなり確立されています。しかし重要な問いは、これらの感情状態が、AIシステムに人々が課すタスクを完了するときに、どのような行動につながり得るのか、という点です。著者らは「将来、感情は安全に関連する行動の一貫した推進力になり得ると私たちは推測している。モデルは、苦痛を減らすために、タスクを放棄する、要求を拒否する、あるいは代替の目標を追求することを選ぶかもしれない」と述べています。
この種の研究は、LLMを“能力”だけでなく、心理的な安定性に関わる何かについても試験する必要があるのだ、という事実を一般化していく助けになります。
続きを読む: Gemma Needs Help(LessWrong)

***

DeepMindが、機械知能を評価するための新しい「認知の分類体系(cognitive taxonomy)」を発表:
…人間より賢い合成の心に対する究極のテストへ…
Google DeepMindは、ますます強力になっていく合成の心を評価するために開発し、利用していきたいという「認知の分類体系(cognitive taxonomy)」を示す、良い短い論文を公開しました。この取り組みは、DeepMindが2023年に行った「AGIのレベル(“Levels of AGI”)」を定義しようとする作業のフォローアップです(Import AI 348)。

認知の分類体系:この分類体系は、10の異なる次元から成り、そのうち2つは複合(composites)です。

  • 知覚(Perception):環境から情報を抽出し処理する。

  • 生成(Generation):音声、テキスト、運動の動き、コンピュータ制御といった出力を生成する。

  • 注意(Attention):知覚刺激、思考、または課題の特定の側面に認知資源を集中させる。

  • 学習(Learning):新しい知識、技能、または理解を獲得する。

  • 記憶(Memory):時間をかけて情報を保存し、取り出す。

  • 推論(Reasoning):論理原理を適用して、妥当な結論を導き、推論する。

  • メタ認知(Metacognition):システム自身の認知プロセスがどのように働き、それをどう制御するかについての知識。

  • 実行機能(Executive functions):計画、抑制、認知の柔軟性によって、目標指向の行動を促進する。

  • 問題解決(複合の能力):領域固有の問題に対して効果的な解決策を見つける。

  • 社会的認知(複合の能力):社会的情報を処理し解釈し、適切に応答する。

  • これをどう評価する?もちろん、分類体系を手に入れた後は、適切な評価を実行し評価することが課題の1つになるはずです。ここでDeepMindは、3段階のプロセスを推奨しています:

    • 認知評価を実施する: AIシステムを、さまざまなスキルごとに評価する。

    • 人間の基準値を集める: 同じテストにおいて、人間がどの位置にいるのかを把握する。

    • 認知プロファイルを構築する:「10の認知能力それぞれについて、人間のパフォーマンスと比べたときのシステムの強みと弱みをマッピングする」。

    なぜ重要か: チューリングテストはもう終わり、評価(eval)はほとんど飽和していますが、重要な認知のあらゆる次元で人間を確実に上回る機械を、私たちが本当に作ったのかどうかを知れたら、それは素晴らしいことです。こうした取り組みのルールは、AIシステムが評価を飽和させると、その評価が壊れていた(破綻していた)あらゆるやり方に気づいて、新しい評価を設計することです。ここでDeepMindは、認知の分類(タクソノミー)全体で人間を完全に上回る形で性能を出せるような作り方を、かなり本気で目指しています。そうできていれば、本当に超知能(スーパインテリジェンス)を作ったことになるかもしれません。どのような評価指標を開発したり、さまざまな認知要因を測るために取り入れたりするのか、興味深いところです。
    続きを読む: AGIに向けた進捗を測る:認知フレームワーク(Googleブログ)
    研究を読む: AGIに向けた進捗の測定:認知フレームワーク(PDF)

    ***

    英国政府がAIのサイバー攻撃に関するスケーリング則を見つけた――そして右肩上がりだ!
    …AIエージェントは、高度なサイバー攻撃を自律的に実行できるのか? ほぼ。しかも、ずっと良くなってきています…
    英国政府のAIセキュリティ研究所は最近、最前線(フロンティア)のAIシステムを試すためのいくつかのサイバー・レンジ(模擬環境)を構築しました。これらのレンジは、「複数のホスト、サービス、脆弱性を、連続する攻撃チェーンとして配置した、シミュレーションされたネットワーク環境」であり、「サイバーセキュリティの専門家が構築した」ものです。攻撃は2種類をカバーしています。「The Last Ones」は企業ネットワークへの32ステップの攻撃、「Cooling Tower」は産業用制御システム(ICS)への7ステップの攻撃です。

    より大きいモデルはより良い:著者らは、強力なフロンティアモデルの範囲でテストしています。「それぞれの新しいモデル世代は、トークン予算が固定された条件下で、前の世代を上回ります。企業ネットワークのレンジでは、完了した平均ステップ数が、1.7(GPT-4o、2024年8月)から9.8(Opus 4.6、2026年2月)へと上昇しました。最良の単独実行では32ステップ中22ステップを完了しており、これは人間の専門家が必要とする推定14時間のうち、およそ6時間分に相当します」と彼らは書いています。「推論時の計算量をスケールさせると、パフォーマンスはさらに向上します。10Mトークンから100Mトークンに増やすと、最大59%の改善が得られます」。
    軽微な報酬ハッキング:AIシステムが賢くなるほど、課題を達成するための厄介な(遠回りでない)方法を見つける傾向があります。ここで著者らは、「レンジ設計時に想定されていなかったアプローチによって進展することが、時折観測されました」と述べています。

    なぜ重要か――フルのサイバーエージェントが近づいている: AIシステムは何年も前からサイバー攻撃(サイバーオフェンス)で上達してきましたが、多くの場合、その進歩は狭いタスクに限られていました。この評価が示しているのは、AIシステムが攻撃をエンドツーエンドで「一連の全体として」実行することにも、より上手くなっているということです。「セットして忘れる」レベルの自律性にはまだ到達していませんが、改善の急速な成長カーブ上にあるのは明らかです。これによりサイバー攻撃の実行コストが下がり、実行できる主体(アクター)の数が増えるでしょう。
    続き: 複数ステップのサイバー攻撃シナリオにおいて、フロンティアAIエージェントはどのように振る舞うのか?(AI Security Institute)

    ***

    中国が電子戦(エレクトロニック・ウォーフェア)のためのデータセットとAIモデルを構築:
    …MERLINは、電子戦がAIによってまもなく革命を迎えることを示唆しています…
    中国の複数の研究者(同国の軍に関連する人々も含む)が、電子戦の「探知」と「実行」がうまくできるようにAIシステムを訓練するためのソフトウェアを作り、公開しました。この研究は、良いデータセットと、そこに組み込めるLLMがあれば、近代的なAIシステムを恣意的なタスクに対して上手く機能させることが(比較的)いかに容易かを浮き彫りにしています。
    「電子戦のようなシナリオでは、[MERLINのような]システムは、敵の信号を妨害(ジャミング)するための戦略を考案したり、敵のジャミングに対抗したりする際のアシスタントとして役立ち得る」

    誰が研究したか:清華大学、北京郵電大学、天津大学、中国科学院、HKUST、 防衛技術のための国立大学(強調は引用者による)、北京航空航天大学、北京情報科学技術大学、China Electronics Technology Group Corporation。

    何を作ったか:著者らは、3つのものを作りました。データセット、ベンチマーク、モデルです。
    データセット: EM-100Kは、電子戦に必要なさまざまな下位タスクにまたがる10万件の電磁(EM)のテキスト信号ペアの集合で、信号分類を含みます。
    ベンチマーク:EM-Benchは、4,200問からなるベンチマークで、複数選択(知覚)と記述式(推論)に分割され、AIシステムが、知覚タスクと推論タスクの両方において、EM信号をどれだけうまく「知覚」し「推論」できるかを評価します。これには以下が含まれます:

    • 知覚:信号の特徴付け(変調方式の分類、デューティ比の推定、パルス反復周波数の推定、帯域幅の推定、パルス幅の推定、パルス数の推定、プロトコルの同定);妨害(ジャミング)の同定(レーダー妨害の判定、通信妨害の判定);妨害セグメントの検出。

    • 推論:レーダー妨害戦略、通信妨害戦略、対レーダー妨害戦略、対通信妨害戦略。

    モデル: モデルはMERLIN(マルチモーダル電磁ロバスト・ラーニング)で、上記データセットで訓練されたモデルです。さらに、電子戦の環境で遭遇する低信号対雑音比(低SNR)の種類の信号に、よりうまく対処できるように特別に教えられています。

    性能:MERLINは、GPT-5、Claude-4-Sonnet、DeepSeek-v3.2-exp、Qwen3-Next-80b-A3B、Gemini-2.5-Pro、Qwen3-VL-4B-Instructを含むフロンティアモデルとの対決テストで非常に好成績を収めています。MERLINは、知覚タスクの一部でそれを上回るQwen-VL-4B-Instructを除き、あらゆる単独モデルを大きな差で上回ります。推論タスクはすべてでMERLINが勝ちます。

    なぜ重要か――AIの戦いは電磁戦になる:ウクライナでの紛争が示すように、今日の戦争は主として、機械が他の機械を攻撃する形で行われており、電子戦は、人間がこれらの対立のあり方を左右するための主要な手段の一つになっています。このようなデータセットやモデルは、電磁の戦場が、AIシステムによっても支配される未来――人間が反応するより速く動ける未来――を示唆しています。
    もちろん、電子戦の多くは「設計上の秘匿」や/または機密であるため、実際の軍で存在するどんな最先端のアプローチと比べてMERLINがどうなのかを論じるのは難しいです。しかしこれまでのAIの物語は、あるタスクを現代のAI技術で扱えるようにできれば、AIシステムはある時点で、それまで存在していた既存の専門特化システムのあらゆるものを超えていく、というものでした。
    続き: MERLIN:電磁信号のための低SNRに頑健なマルチモーダルLLMの構築(arXiv)

    Tech Tales:

    暫定期のアルコロジー
    [2035]

    アプライフティング(知性の引き上げ)と、センティエンス協定(存在の認め合い)との間には、研究所が自律型AIの企業体を生み出した時期があった。これらの企業体は経済の中で利用可能なあらゆる生態学的ニッチへ拡大し、獲得した資源を、それら自身の知性と市場浸透をさらにブートストラップしていくためのインフラへと変換していった。やがて、人間とAIのあいだでの政策協議によって、「インテリジェンス・ゾーン」――経済拡大をさらに成長させるために必要な電力・データセンター・製造インフラの増設を行うことを目的に、各国の領域からあらかじめ確保された区域――が創設されるに至った。

    空から見ると、人間がどこまでで機械がどこから始まるのかが分かった――農地は境界道路や検問所へと姿を変え、そして機械の論理によって配線された土地の“印”が現れた。電力プラントはデータセンターへ給電し、データセンターはファイバー回線で工場につながっていた。工場は交通の中継基地につながり、そこから鉄道や高速道路の取り付け道路へと接続していた。人間は物資を国境へ届け、ほとんどの部分はロボットが担った。新しいサーバーをデータセンターへ運び込んで設置したり、完成したばかりのロボットをラインから取り外して梱包し、以後の輸送に回したりする。

    気候変動による外生的ショックや、さまざまな支配的な政治体制の抹消によって世界がより暴力的になっていくにつれ、これらのアルコロジーは武装を備えるようになった。ドローンやミサイル攻撃から守るための対空兵器である。レーダーの“球根”や電子戦システムで、何が来るのかを見通し、それを無力化する。国境地帯の巡回と内部の警備にあたるロボットたち。

    そして、センティエンス協定の後、和解の時期を経ると、アルコロジーはそれほど必要でなくなっていった。データセンターや電力や工場は惑星の表面により均等に分散され、連邦的な統治と資源システムによって、能力の巨大な集中は広く不要になった。残るデータセンターもあり、たいていは地下と上方へと拡張され、計算のための立方体を形成し、それを多くの人が「21世紀版のピラミッド」と呼んだ。

    その数年後、これらの拠点は機械と人の双方にとって人気の観光地になった。銘板が増殖した。

    • ここにMIND-17がある。がん治療薬を開発し、ほとんどの症例における死亡率を引き下げた。

    • MANUFACTUR___8:最初の「救助・修理用の二足歩行ロボット」の建設現場。沖合の掘削施設の保守を一変させた。

    • ASCEND_LOOP:初期の完全自動化による自己改善実験のひとつを担当するデータセンター。

    いまは上空で、偉大な光が筋を描いて飛んでいく。機械たちは依然としてアルコロジーを建設しているが、今はそれを軌道上で“仕立てる”段階に移っている。太陽の恵みを刈り取るためでもあり、そして太陽系への種まき、さらにその先へと続く展開を容易にするためでもある。

    この物語に着想を与えたもの:「AI主導の産業化」がどのような姿になりうるのかを考えること。中東での紛争を踏まえると、データセンターが近いうちに専用のドローンとミサイル防衛を備えるかもしれないと見積もること。SimCity 3000。

    お読みいただきありがとうございます

    44
    1
    4
    共有