Claude Codeの漏えいアーキテクチャを使って、9Bモデルをプロダクションエージェントへ変えた方法
2026年3月31日、Anthropicは誤って、Claude CodeのTypeScriptソースコード512,000行をnpmパッケージとして出荷してしまいました。多くの人がそれをニュースとして扱う一方で、私たちはそれを設計図として捉えました。
実験
その漏えいに隠されていたアーキテクチャ上の原則――構造化プロンプト、MicroCompact圧縮、ハードな打ち切り、ツールの遅延ロード――を、家庭用GPU(RTX 5070 Ti、VRAM 16GB)上で動作する小型の9Bモデル(qwen3.5:9b)に適用しました。
結果は予想外でした:
| 指標 | 最適化前 | 13回の最適化後 |
|---|---|---|
| ツール呼び出し | ランダムな失敗 | 100%成功(18テスト) |
| 出力品質 | 4件の問題が見つかる | 25+ 件の構造化された発見 |
| トークン効率 | 応答あたり1024以上 | 131トークン |
| マルチステップタスク | 探索に行き詰まる | 確実な6ステップ実行 |
| コスト | $0 API + $0 ハードウェア | それでも$0 |
重要な洞察
生のモデル能力 ≠ エージェント能力。
さらに、Googleの新作Gemma 4 E4B(本日リリース)と、XiaomiのMiMo-7Bもテストしました。生のベンチマークではGemma 4が勝っていました――より速い速度(144 tok/s vs 106)、ツール選択精度の向上(5/5 vs 3/5)です。
しかし、私たちの13個の最適化を適用した後は? 9Bモデルが結果を逆転させました:
- qwen3.5: ツール呼び出し5回、1954語の診断レポート
- Gemma 4: ツール呼び出し0回、空の出力
アーキテクチャの規律に従うモデルは、生の知能で勝るモデルを上回る。
この本に書かれていること
すべてを書き下ろしました――9章、約42,000語:
- 漏えいされた設計図と、その理由(アーキテクチャ > パラメータ)
- 事前確認(プリフライト)の環境チェック付きハードウェア構成
- ファミリーをまたいだモデル比較(qwen3.5 vs Gemma 4 vs MiMo)
- 9Bモデルを制御するための出力コントラクト
- A/Bデータ付きの全13個の最適化レシピ
- どの工場エージェントをローカルにできるか(17のうち10)
- Opusを限界まで押し上げたときに何が起きるか
- エージェント間の通信プロトコル
- 30日間のデプロイ計画ロードマップ
バイリンガル版(繁體中文 + English)、EPUB + PDF。
こちらから入手
16GBのGPUが埃をかぶっているなら、この本が「ゼロコストのAIエージェント工場」に変える方法を教えてくれます。
ONE WALL AI Publishing で制作――17のAIエージェントにより駆動される、自動化された電子書籍工場。
返却形式: {"translated": "翻訳されたHTML"}



