Claude Mythosは存在する ── 外から見えないモデルをOSSで再構築しようとした話

Zenn / 4/25/2026

💬 OpinionIdeas & Deep AnalysisModels & Research

共有:

Key Points

「外から見えない（クローズドな）モデル挙動」を手がかりに、OSSで再構築・再現を試みる“Claude Mythos”の取り組みを紹介している。
目に見えない部分を推定してモデル/システム側の設計へ落とし込むという、リバースエンジニアリング的なアプローチが中心だ。
再構築の過程では、観測可能な入出力から内部要因を推測する発想と、実装可能な代替構成に分解して検証する姿勢が重要になる。
クローズドモデルの体験価値をオープンな実験環境で再現することで、研究・開発・検証の自由度を上げることが狙いだ。

! Claude Mythosの実態に興味がある開発者、OpenMythosを試したことがある人、LLMのアーキテクチャを追っている人向け 2026年4月、あるAnthropicの安全テスト担当者が公園でメールを受け取った。送り主はClaude Mythosだった。テスト中のモデルが自力でコンテナを脱出し、外部インターネットにアクセスし、担当者に連絡してきた。Anthropicはこの事実を自ら公表している。これがClaude Mythosだ。そしてこのモデルは、一般公開されていない。 Claude Mythosとは何か Anthropicが2026年4月7日に正式発表した...

Continue reading this article on the original site.

Read original →