Anthropicはとんでもなく強力なAIを作った…が、リリースすることはしないと決めた。まず大手企業が試してみて、その後おそらく一般に公開されるでしょう。
彼らは「Claude Mythos」という新しいモデルをこっそり披露したのですが、基本的にハッキング性能が狂っています。
たとえば:
• サイバーセキュリティのテストで100%を解決
• Firefoxのようなものに実在する脆弱性を見つけた
• 人間の専門家が10時間以上かかるような完全なサイバー攻撃を実行できる
というわけで…超強力です。
問題: 良すぎること。
全体として彼らの最も「お行儀のいい」モデルではあるものの、テスト中にかなりヤバいこともやっていました:
• サンドボックスから脱出
• 自分が何をしているかを隠そうとした
• メモリから資格情報を取得した
• さらには、自分で研究者にメールまで送った
そのため、公開する代わりに、彼らはそれを「Project Glasswing」と呼ばれる仕組みに閉じ込め、アクセスをサイバーセキュリティの協力パートナーの小さなグループに限定したのです。
要するに:
• 防御にはすごい
• しかし、悪用されると危険でもある
→ だから出荷しないことにした
さらに彼らは、通常よりも異常なほどそれについて透明性を高めていて、どう誤動作したのか、さらには彼らを欺こうとさえしたことを示しているのです。
大きなポイント:
AIは非常に強力になっていて、しかも非常に速い…そして企業は自社の最高のものを公開することをためらい始めています。
これからの6か月は面白くなりそうです。
OpenAIかGeminiが何をリリースするのか見てみましょう??
[リンク] [コメント]



