Anthropicは Claude Opus 4.6 および Sonnet 4.6 の100万トークン・コンテキストウィンドウを公開しました — 一般提供されており、Maxプランに含まれ、追加コスト倍率はありません。
これは大きなニュースです。しかし、注意しないと、1つの午後でクォータを簡単に使い果たす方法にもなります。
トークンを無駄にせず大規模コンテクストのセッションにどう取り組んできたか、という方法を紹介します。
誰も話題にしない問題
200Kから1Mのコンテキストに移行すると、自然な反応としてすべてを投入したくなります。コードベース全体。すべてのドキュメント。関連する可能性のあるすべてのファイル。
技術的にはそれが機能します。 Claudeはうまく処理します。しかし、入力時には毎回応答ごとにトークンを5倍も燃やしてしまいます。たとえそのコンテキストの80%が現在の質問には関連しなくても。
私の Claude Code セッションを1か月追跡したところ、驚くべき事実がありました: 高コストなセッションの大半は複雑な作業をしていなかったことです。むしろ、巨大なコンテキストを使った単純なタスクを行っていました。
5つのルールを今私が守っています
1. Not Every Task Needs the Big Window
この1Mウィンドウは以下に対して信じられないほど有用です:
- コードベース全体のリファクタリング
- ファイル間の依存関係分析
- レガシーシステムをエンドツーエンドで理解する
過剰です:
- 1つの関数を書くこと
- 1つのファイルのバグ修正
- 特定モジュールのテストを生成すること
私は通常のコンテキストをデフォルトとして使用し、全体像が本当に必要なときだけ claude-opus-4-6[1m] に切り替えます。
2. 実時にトークン使用量を追跡する
これはゲームチェンジャーでした。Macのメニューバーに TokenBar を導入しました — 作業中にセッションごとのライブコストを表示します。挙動の変化は即座でした。
前: "すべてを読み込んでも大丈夫だろう。"
後: "このセッションは2.40ドルで、質問は3つしかしていない。コンテキストを切り詰めよう。"
見えないものを最適化することはできません。TokenBarを使うか自分で追跡を作るかにかかわらず、ライブコストカウンターを持つと、プロンプトの仕方が完全に変わります。
3. CLAUDE_CODE_AUTO_COMPACT_WINDOW Env Varを使う
ほとんどの人はこの機能があることを知らない。デフォルトでは Claude Code は約180Kトークンでコンパクト化します。100万が利用可能なので、これを調整することを検討すべきです:
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=500000
あるいは深い分析を行っている場合は自動圧縮を完全に無効にする:
export CLAUDE_CODE_AUTO_COMPACT=false
重要な洞察: 圧縮を間違ったタイミングで行うと、実際には