AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

Cloudflare、損失なしLLM圧縮ツール「Unweight」をオープンソース化

Reddit r/LocalLLaMA / 2026/4/18

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

原文を読む →

共有:

要点

Cloudflareは、出力精度を損なわずにLLMのサイズを15〜22%削減できる損失なし圧縮システム「Unweight」を公開しました。
MetaのLlama 3.1 8Bでの検証では、Nvidia H100 GPU上でMLP重みを圧縮することで約3GBのVRAMを節約できるなど、ハードウェア面での効果が示されています。
CloudflareはGPUカーネルをGitHubでオープンソース化し、手法を説明する技術論文も公開しました。
同社は、圧縮対象をアテンション重みにも拡張して、LLMのメモリや計算コストをさらに削減する計画です。

Cloudflare は、出力精度を犠牲にせずに LLM のサイズを 15〜22% 削減する可逆圧縮システム「Unweight」を公開しました。
Meta の Llama-3.1-8B では、このツールが Nvidia H100 GPU 上で MLP の重みを圧縮することで、およそ 3 GB の VRAM を節約します。
Cloudflare は GitHub で GPU カーネルをオープンソース化し、技術論文を公開しました。圧縮を注意（attention）の重みにも拡張する計画があります。

/u/Otis43 によって投稿
[link] [comments]

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 4/18Dailyインサイトを見る →

関連記事

Cloudflare、AIエージェントインフラを刷新—Dynamic Workers・Artifacts・Sandboxesを一挙発表

Cloudflare、AIエージェントインフラを刷新—Dynamic Workers・Artifacts・Sandboxesを一挙発表

Innovatopia

「Claude Mythos」の神話が崩れる—小型のオープンモデルが、Anthropicが示したのと同じサイバーセキュリティ脆弱性を狙う

「Claude Mythos」の神話が崩れる—小型のオープンモデルが、Anthropicが示したのと同じサイバーセキュリティ脆弱性を狙う

THE DECODER

Claude Opus 4.7 vs 4.6：何が実際に変わり、移行で何が壊れるのか

Claude Opus 4.7 vs 4.6：何が実際に変わり、移行で何が壊れるのか

Dev.to

AI、希望、そして癒やし：自分専用のmRNAがんワクチン・パイプラインを作れるのか

AI、希望、そして癒やし：自分専用のmRNAがんワクチン・パイプラインを作れるのか

Dev.to

「ホテルAI視認性」危機：なぜAIは自社サイトよりもレビューサイトを引用するのか

「ホテルAI視認性」危機：なぜAIは自社サイトよりもレビューサイトを引用するのか

Dev.to

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告