Claude Codeのトークン使用量を、自前のOSをエージェントに与えることで68.5%削減した

Reddit r/artificial / 2026/3/29

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

共有:

要点

この記事では、「エージェンティックなJSONネイティブOS」を導入することで、無駄の多い人間向けの状態チェックやコールドスタート時の繰り返しの文脈再発見を避け、Claude Codeのトークン使用量を68.5%削減できたと主張している。
シナリオ別のベンチマーク結果として、セマンティック検索とgrep/catの比較で91%、エージェントのピックアップとコールド時のログ解析の比較で83%、状態ポーリングと複数のシェルコマンドの比較で57%といった大きなトークン節約が報告されている。
この取り組みは、提供されているベンチマークスクリプト（python3 tools/bench_compare.py）により完全に再現可能であるとされ、5つの実シナリオにわたる結果が含まれている。
OSはMCPを通じてClaude Codeと統合し、ローカル推論はOllamaで実行する設計で、プロジェクトのライセンスはMITとなっている。
著者は、エージェンティックなワークフローを実行している実務者に対して、アプローチを検証し反復するためのフィードバックを求めている。

すべてのエージェントは、人間のために構築されたインフラストラクチャ上で動作しています。すべての状態チェックでは、9つのシェルコマンドが実行されます。

すべてのコールドスタートでは、文脈を最初から再発見します。

それは設計上の無駄です。

エージェント型のJSONネイティブOSがこれを解決します。5つの実際のシナリオにわたるベンチマーク：

セマンティック検索 vs grep + cat: トークンを91%削減

エージェントのピックアップ vs コールドのログ解析: トークンを83%削減

状態ポーリング vs シェルコマンド: トークンを57%削減

全体: 68.5%削減

ベンチマークは完全に再現可能：python3 tools/ bench_compare.py

MCP経由でClaude Codeに接続でき、Ollamaを通じてローカル推論を実行し、MITライセンスです。

実際にエージェント型のワークフローを動かしている人からのフィードバックが欲しいです。