AI Navigate

インサイト最新記事一覧 AI大全

広告

AA-SVD：大規模言語モデル圧縮のためのアンカー付きかつ適応的SVD

arXiv cs.LG / 2026/4/3

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

本論文は、再学習を必要とせずに10億パラメータ級のLLMを圧縮する、高速な低ランクSVDベースのフレームワークであるAA-SVDを提案する。
レイヤーごとの圧縮中に生じる分布シフトによる誤差伝播の問題に対し、上流入力のシフトを明示的にモデル化するとともに、元のレイヤー出力へのアンカーリングを行うことで対処する。
個々のレイヤーを圧縮するだけでなく、AA-SVDは各Transformerブロックをエンドツーエンドで改良し、ブロック単位の出力歪みを低減するとともに、蓄積された誤差に対する共同補償を可能にする。
実験により、AA-SVDは圧縮率の幅広い範囲で従来のSVD系ベースラインを上回ることが示される。特に、他手法が大きく性能劣化する、または破綻するほどの厳しい圧縮予算のもとでは、顕著な改善が得られる。

関連記事

Black Hat Asia

Black Hat Asia

AI Business

Ray-Ban Meta、日本上陸へ｜3年越しの到着が意味するもの

Ray-Ban Meta、日本上陸へ｜3年越しの到着が意味するもの

Innovatopia

今年90000人のテック労働者が解雇され、誰もがAIのせいにしているが、それは物語の全てではない

今年90000人のテック労働者が解雇され、誰もがAIのせいにしているが、それは物語の全てではない

Dev.to

Microsoftの100億ドル規模の日本投資は、次のAIの戦場が国家インフラであることを示す

Microsoftの100億ドル規模の日本投資は、次のAIの戦場が国家インフラであることを示す

Dev.to

TII、「Falcon Perception」を発表：自然言語プロンプトからのオープン語彙グラウンディングおよびセグメンテーションのための、0.6Bパラメータのアーリーフュージョン・トランスフォーマー

TII、「Falcon Perception」を発表：自然言語プロンプトからのオープン語彙グラウンディングおよびセグメンテーションのための、0.6Bパラメータのアーリーフュージョン・トランスフォーマー

MarkTechPost

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告