Claude Opus 4のAPI代が1/30になった。Claude Code subagentにローカルのQwen3を繋いだだけだ

Zenn / 2026/4/22

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • Claude Opus 4のAPIコストが従来比で1/30になったという実務的なコスト削減事例が共有された。
  • Claude Codeのsubagentにローカルで動かしたQwen3を接続するだけで、最終的な支払いが大幅に抑えられる仕組みが示されている。
  • “高価なクラウドLLMを常時使う”前提を崩し、ローカルLLMを分担させることで運用コストを最適化できることがポイント。
  • エージェント構成(subagent)とモデルの使い分けが、実コストと性能の両面に効く具体例として示唆される。
夜間バッチ1回で$3.60だったOpus課金が、$0.12に落ちた。Opus 4は今も毎晩、同じ本数だけ回している。止めていない。削ったのは「Opusに投げる必要がなかったタスク」だけだ。 月$108が$3.60になった計算になる。Orchestrationだけ残して、他を全部ローカルに逃がしただけだ。 このノートでわかることClaude Code subagentにLM Studio経由のローカルモデルを繋ぐ具体設定 どのタスクをローカルに落としどれをOpusに残すかのルーティング設計 実測のトークン削減と、品質を落とさないための線引き 課金不安ゼロで自律システムを回すための構成判断 ...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →