StructKV：スケーラブルな長文コンテキスト推論のための構造的スケルトンの保持

arXiv cs.CL / 2026/4/9

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

StructKVは、数百万トークン以上の長文コンテキストにおけるLLM推論のための、構造を意識したKVキャッシュ圧縮手法として提案されている。長距離の振る舞いを損なうことなく、メモリ/帯域のボトルネックを低減することを目的とする。
このアプローチでは、単一層の局所的な重要度（local saliency）に依存するのではなく、ネットワークの深さにわたる注意パターンからGlobal In-Degree Centralityを計算することで、「グローバルな情報ハブ（global information hubs）」を同定する。
情報理論的な指標を用いたDynamic Pivot Detectionにより、圧縮に最適な層を適応的に選択する。これにより、トークンがグローバルには重要である一方で、局所的には休眠状態になり得るケースに対応する。
StructKVはさらに、Structural PropagationとDecouplingによって計算制約とメモリ制約を分離し、スケーラブルな長文コンテキスト推論を可能にする。
LongBenchとRULERでの実験により、従来のトークン除去/圧縮手法と比べて、長距離依存関係の保持が向上し、検索（リトリーバル）の頑健性もより強いことが示されている。

日経XTECH

日経XTECH

Reddit r/artificial

Reddit r/artificial

Dev.to