ローカルのQwen 3.5 122B環境で、実際のトークン無駄を測定しました。数値が信じられないレベルです。クエリのコンテキストを1,373トークンから73トークンに削減する、コンパイル時のアプローチを見つけました。さらに、素朴なJSON変換をするとそれが30%悪化することも判明しました。
完全なベンチマークと議論はこちら:
https://www.reddit.com/r/openclaw/comments/1sb03zn/stop_paying_for_tokens_your_ai_never_needed_to/
[リンク] [コメント]




