CodeComp: エージェント型コーディングのための構造的KVキャッシュ圧縮
arXiv cs.CL / 2026/4/14
📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- CodeCompは、長いコードベースに対するエージェント型コーディングタスクが、メモリ制限の下でのLLMのKVキャッシュによってボトルネック化される問題に対処し、推論効率のための主要なレバーとしてKV圧縮を位置付けています。
- 既存の注意重み(attention)に基づくKV圧縮では、プログラム理解に重要なコードトークン(例:呼び出し箇所、分岐条件、代入)を構造的に重要なものとして誤って破棄してしまう可能性があります。
- CodeCompは、Joernで抽出したコードプロパティグラフの事前知識(priors)を用いて、静的なプログラム解析を推論に注入することで実現する、学習不要(training-free)の圧縮手法です。
- バグローカライゼーションおよびパッチ生成ベンチマークに関する実験では、CodeCompが同一のメモリ予算下で注意重みのみの圧縮ベースラインを上回り、過度な圧縮条件でもフルコンテキスト精度の大部分を回復できることが示されています。
- このアプローチは、モデルの変更なしでSGLangベースのエージェント型コーディングのパイプラインにシームレスに統合できると報告されています。

