Claude Codeで80Kトークンを2.1Kに削減する方法

Zenn / 2026/4/20

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage

要点

  • Claude Codeにおいて、入力/出力で肥大化するトークン量を削減し、80Kトークン規模を2.1Kに圧縮する実践手順を示している。
  • トークン削減の鍵として、プロンプトやコンテキストの持ち方(必要情報の取捨選択、要約・圧縮、参照方針など)の設計が重要だと述べている。
  • 削減後もタスクの意図や制約を維持するため、指示文の構造化やフォーマット統一といった工夫を行う。
  • トークンコストや応答速度の観点から、同じ作業をより低コストで回すためのワークフロー最適化として位置づけている。
78,000〜92,000トークン。autonomous-brainが夜間自走を始めて2週間後、僕の1セッションはそれだけ食っていた。 応答が遅い。文脈を忘れる。同じファイルを3回読みに行く。 「Pineconeか」と思った。「embeddings入れるか」とも思った。やめた。インフラを増やしたくなかった。 結果、2,100トークン前後で安定した。削減率97%。embeddingsゼロ、vector DBゼロ、追加インフラゼロ。 このノートでわかること コンテキストが肥大化する本当の理由(記憶不足ではなく「廃棄の設計不在」) embeddingsなしで2,100まで削れる3本柱のア...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →