CodeComp: エージェント型コーディングのための構造的KVキャッシュ圧縮

arXiv cs.CL / 2026/4/14

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • CodeCompは、長いコードベースに対するエージェント型コーディングタスクが、メモリ制限の下でのLLMのKVキャッシュによってボトルネック化される問題に対処し、推論効率のための主要なレバーとしてKV圧縮を位置付けています。
  • 既存の注意重み(attention)に基づくKV圧縮では、プログラム理解に重要なコードトークン(例:呼び出し箇所、分岐条件、代入)を構造的に重要なものとして誤って破棄してしまう可能性があります。
  • CodeCompは、Joernで抽出したコードプロパティグラフの事前知識(priors)を用いて、静的なプログラム解析を推論に注入することで実現する、学習不要(training-free)の圧縮手法です。
  • バグローカライゼーションおよびパッチ生成ベンチマークに関する実験では、CodeCompが同一のメモリ予算下で注意重みのみの圧縮ベースラインを上回り、過度な圧縮条件でもフルコンテキスト精度の大部分を回復できることが示されています。
  • このアプローチは、モデルの変更なしでSGLangベースのエージェント型コーディングのパイプラインにシームレスに統合できると報告されています。

Abstract

フォールトローカライゼーションやパッチ生成といったエージェント型のコードタスクでは、メモリ制約が厳しい状況下で長大なコードベースを処理する必要があり、そのためKey-Value(KV)キャッシュが主たる推論のボトルネックになります。既存の圧縮手法はトークン重要度の推定に注意(attention)信号にのみ依存しており、呼び出し箇所(call sites)、分岐条件(branch conditions)、代入(assignments)のような、コード理解に不可欠な構造的に重要なトークンを体系的に破棄してしまいます。我々はCodeCompを提示します。CodeCompは、Joernから抽出したコードプロパティグラフ(Code Property Graph)に関する事前知識(priors)を通じて静的プログラム解析をLLM推論へ取り込む、学習不要(training-free)のKVキャッシュ圧縮フレームワークです。バグローカライゼーションおよびコード生成のベンチマークにおいて、CodeCompは等しいメモリ予算のもとで注意のみの圧縮ベースラインを一貫して上回り、過度なKVキャッシュ圧縮下でもフルコンテキスト精度の大部分を回復します。また、圧縮なしのフルコンテキスト推論と同等のパッチ生成品質を達成し、モデル変更なしでSGLangベースのエージェント型コーディングのパイプラインへシームレスに統合されます。