Mythos の新しい SWE-bench の数値が早くも公開され、現在のベストとの差が恐ろしいほど大きいです。
SWE-bench Verified:
Mythos: 93.9%
Opus 4.6: 80.8%
SWE-bench Pro:
Mythos: 77.8%
Opus 4.6: 53.4%
この Pro スコアは、自律的なコーディングにおける約25%の飛躍です。さらに、Project Glasswing が深いアーキテクチャ理解をもたらすのではないかという噂を加えると、プロンプトと完全にデプロイされたプロダクトの間にある障壁は、基本的に消えています。
Mythos がリリースされたら、あなたが何を作れるのか想像してみてください。
必要なのはノートパソコンとアイデアだけです。最初に何を作りますか?
[リンク] [コメント]




