| 彼らの244ページにも及ぶシステムカードを掘り返さなくても済むように言うと、ぜひこの動画の解説を確認することを強くおすすめします[リンク:https://www.youtube.com/watch?v=PQsDXTPyxUg]。上の私のミームにある「安全上のリスク」という言い訳が、実際には天文学的な計算コストの話にすぎない理由を、完璧に分解してくれています。 Anthropicは、Claude Mythos Previewが神格級のモデルで、OpenBSDでゼロデイを見つけられるため「単に危険すぎて公開できない」だけだという物語をかなり強く推しています。でも、(彼らのシステム文書の21ページ目にある)2枚目の画像にスワイプすると、その幻想は崩れます。 彼らはMythosに単に質問したわけではありません。検閲なしのチェックポイントを使い、ガードレールを剥がし、推論に延長した時間を与え、ドメイン固有のツールに縛り付け、そして大規模な計算コスト(報道では1回あたり約$50)をかけて何千回もブルートフォースで実行したのです。単発でバグを見つける確率は、たぶんパーセントの数分の一どころではないでしょう。 これは「危険な」モデルというより、PRキャンペーンに包まれたスケール不可能なAPIコストの話です。私たちは、すでに同じようなエージェント型のスケーリングがオープンソースとローカルのコミュニティで起きているのを見ています:
クローズドソースの領域でも、OpenAIのGPT-5.4をxhigh reasoning tierのCodexアプリに投入し、コードベースへの完全なアクセスを与えて、8時間以上自律的に走らせれば、あなたが寝ている間に20件の致命的なバグをブルートフォースで掘り当てることになるでしょう。 2026年にゼロデイを見つけることは、エージェント型のツール群と莫大な計算予算の掛け算であって、生のモデル知能が魔法のように飛躍した結果ではありません。Anthropicの「絶滅レベルの脅威」マーケティングに、オープンソース・コミュニティが遅れを取っていると納得させられないでください。 [link] [comments] |
『Mythos Preview “Safety” Gaslight』:Anthropicは常軌を逸した計算コストを隠しているだけだ。オープンモデルはすでにこれをやっている。
Reddit r/LocalLLaMA / 2026/4/9
💬 オピニオンSignals & Early TrendsIdeas & Deep Analysis
要点
- 本稿は、Claude Mythos Previewを差し控えるためのAnthropicの「安全性」上の正当化は、独自に高いモデルリスクというより、極端に高い計算コストの隠れ蓑だと主張している。
- システムカードの内訳を示すことで、Mythosは検閲なしのチェックポイント利用、ガードレールの削除、長時間の思考、ドメイン向けツール統合、大規模な反復的試行(報告によれば1回あたり約50ドル)を行った後にのみ、ゼロデイ級のバグを見つけるとされている。
- 著者は、1回の実行でバグが発見される確率はかなり低い可能性が高いと論じ、その結果は知能の飛躍というより、大量の力ずくの反復に依存していると示唆する。
- この手法を、オープンおよびローカルのコミュニティが、エージェント的な「最適化ループ」や、並列のツール呼び出しの群れ(例:OpenClawで動かすGLM-5.1、Kimi 2.5のエージェント・スウォーム・モード)を用いて、問題点の探索をスケールさせていることに例える。
- 本稿は、2026年のゼロデイ発見は、オープン・エコシステムが埋められないギャップというより、エージェント的なツーリングと計算予算の影響が大きいと結論づける。



