エージェントフレームワークはセッションごとに静的ファイルを再送することで約35万トークン以上を浪費。95%削減をベンチマークで確認。

Reddit r/artificial / 2026/4/4

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisTools & Practical Usage

要点

  • ローカルのQwen 3.5 122B環境でのベンチマークでは、エージェントフレームワークが静的ファイルを繰り返し再送することで、セッションあたりおよそ35万トークン以上を無駄にしてしまう可能性があることが分かった。

ローカルのQwen 3.5 122B環境で、実際のトークン無駄を測定しました。数値が信じられないレベルです。クエリのコンテキストを1,373トークンから73トークンに削減する、コンパイル時のアプローチを見つけました。さらに、素朴なJSON変換をするとそれが30%悪化することも判明しました。

完全なベンチマークと議論はこちら:

https://www.reddit.com/r/openclaw/comments/1sb03zn/stop_paying_for_tokens_your_ai_never_needed_to/

投稿者 /u/TooCasToo
[リンク] [コメント]