すべてのエージェントは、人間のために構築されたインフラストラクチャ上で動作しています。すべての状態チェックでは、9つのシェルコマンドが実行されます。
すべてのコールドスタートでは、文脈を最初から再発見します。
それは設計上の無駄です。
エージェント型のJSONネイティブOSがこれを解決します。5つの実際のシナリオにわたるベンチマーク:
セマンティック検索 vs grep + cat: トークンを91%削減
エージェントのピックアップ vs コールドのログ解析: トークンを83%削減
状態ポーリング vs シェルコマンド: トークンを57%削減
全体: 68.5%削減
ベンチマークは完全に再現可能:python3 tools/ bench_compare.py
MCP経由でClaude Codeに接続でき、Ollamaを通じてローカル推論を実行し、MITライセンスです。
実際にエージェント型のワークフローを動かしている人からのフィードバックが欲しいです。
[link] [comments]



