AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

DASH-KV：非対称KVキャッシュ・ハッシングで長文コンテキストLLM推論を高速化

arXiv cs.CL / 2026/4/22

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

原文を読む →

共有:

要点

本論文は、標準的な注意機構が持つ二次的な計算コストを削減することで、長文コンテキストLLM推論を高速化するDASH-KVを提案している。
DASH-KVは、注意を非対称な深層ハッシングによる近似最近傍探索として作り替え、クエリとキーの違いを踏まえて符号化を設計している。
効率と精度の両立のため、重要トークンに対しては動的に高精度（フル精度）計算を保持する混合精度メカニズムを導入している。
LongBenchでの実験では、DASH-KVが先行のKVキャッシュ圧縮やベースライン手法を大きく上回り、フルアテンションと同等の性能を保ちつつ、計算量をO(N^2)から線形のO(N)に削減できることが示されている。
著者は検証や導入を支援するために、GitHubリンク先で実装コードを公開している。

関連記事

NEC、入社3カ月の新人が役員を「コンサル」／テスラのE2E自動運転技術FSD、オランダ承認など、注目記事を音声化

NEC、入社3カ月の新人が役員を「コンサル」／テスラのE2E自動運転技術FSD、オランダ承認など、注目記事を音声化

日経XTECH

35歳主任エンジニア、管理職か専門職かの選択に悩むキャリアの岐路に

35歳主任エンジニア、管理職か専門職かの選択に悩むキャリアの岐路に

日経XTECH

IPAが「Open Data Spaces」仕様公開、AIエージェント対応で海外も注目

IPAが「Open Data Spaces」仕様公開、AIエージェント対応で海外も注目

日経XTECH

Artlist Studioがローンチ、ARR 3億ドルに到達—生成AI動画の「連続性」問題に挑むプロダクション基盤

Artlist Studioがローンチ、ARR 3億ドルに到達—生成AI動画の「連続性」問題に挑むプロダクション基盤

Innovatopia

U-NetとTransformerを合体！医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介｡

U-NetとTransformerを合体！医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介｡

AI-SCHOLAR

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告