エージェントフレームワークはセッションごとに静的ファイルを再送することで約35万トークン以上を浪費。95%削減をベンチマークで確認。

Reddit r/artificial / 2026/4/4

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisTools & Practical Usage

共有:

要点

ローカルのQwen 3.5 122B環境でのベンチマークでは、エージェントフレームワークが静的ファイルを繰り返し再送することで、セッションあたりおよそ35万トークン以上を無駄にしてしまう可能性があることが分かった。

ローカルのQwen 3.5 122B環境で、実際のトークン無駄を測定しました。数値が信じられないレベルです。クエリのコンテキストを1,373トークンから73トークンに削減する、コンパイル時のアプローチを見つけました。さらに、素朴なJSON変換をするとそれが30%悪化することも判明しました。

完全なベンチマークと議論はこちら:

AI Business

AI Business

note

note

note