Claude Opus 4のAPI代が1/30になった。Claude Code subagentにローカルのQwen3を繋いだだけだ

Zenn / 4/22/2026

💬 OpinionDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

Key Points

  • Claude Opus 4のAPIコストが従来比で1/30になったという実務的なコスト削減事例が共有された。
  • Claude Codeのsubagentにローカルで動かしたQwen3を接続するだけで、最終的な支払いが大幅に抑えられる仕組みが示されている。
  • “高価なクラウドLLMを常時使う”前提を崩し、ローカルLLMを分担させることで運用コストを最適化できることがポイント。
  • エージェント構成(subagent)とモデルの使い分けが、実コストと性能の両面に効く具体例として示唆される。
夜間バッチ1回で$3.60だったOpus課金が、$0.12に落ちた。Opus 4は今も毎晩、同じ本数だけ回している。止めていない。削ったのは「Opusに投げる必要がなかったタスク」だけだ。 月$108が$3.60になった計算になる。Orchestrationだけ残して、他を全部ローカルに逃がしただけだ。 このノートでわかることClaude Code subagentにLM Studio経由のローカルモデルを繋ぐ具体設定 どのタスクをローカルに落としどれをOpusに残すかのルーティング設計 実測のトークン削減と、品質を落とさないための線引き 課金不安ゼロで自律システムを回すための構成判断 ...

Continue reading this article on the original site.

Read original →