SimDiff：類似性と差分による深さプルーニング

arXiv cs.AI / 2026/4/22

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、冗長な層を削除して大規模言語モデルの推論効率を高める「深さプルーニング」のための新しい基準SimDiffを提案しています。
従来の主にコサイン類似度に依存する1次元の手法と異なり、SimDiffは表現の類似性と変換の差分という2つの補完的な指標で層の重要度を評価します。
変換の差分は2つのメトリクス—MSSD（外れ値に敏感で決定的な補正を重視）とMASD（頑健に平均的寄与を測る）—で定量化し、単一ヒューリスティックに見られる不安定さや破滅的な崩壊を回避します。
0.5B〜13Bパラメータの複数モデルでの実験の結果、SimDiffはさまざまなプルーニング率において既存のベースラインを上回り、LLaMA2-7Bでは25%プルーニングで性能を91%以上維持し、LLaMA3.1-8Bでは12層の削除で最大1.49×の推論高速化を達成します。
大幅にプルーニングしたモデルでも最小限のファインチューニングで効果的に復元できることを示しており、実運用面での有用性が示唆されます。

要旨: 深度プルーニングは、冗長な層を特定して除去することで、大規模言語モデル（LLM）のデプロイ効率を改善します。この特定プロセスにおける広く受け入れられた標準は、コサイン距離を用いて層間の類似度を測定することです。しかし我々は、この1次元のヒューリスティックのみに依拠する手法では、異なるアーキテクチャ間で予測不能な性能が現れたり、さらには壊滅的な崩壊すら起こり得ることを見出しました。この問題に対処するために、我々はSimDiffという新しい層重要度の基準を提案します。この基準は、2つの直交する観点から層を同時に評価します。すなわち、表現の類似性と変換の差分です。差分は2つの異なる指標によって定量化されます。外れ値に敏感で、決定的な修正を行う層を特定するMSSDと、層の平均的な寄与を頑健に測定するMASDです。パラメータ数0.5Bから13Bまでの複数のモデルに対する大規模な実験により、SimDiffが様々なプルーニング率において、最先端のベースラインを大幅に上回ることを示します。特に、我々の手法は25%のプルーニング率でLLaMA2-7Bの性能の91%以上を維持し、LLaMA3.1-8Bにおいて12層をプルーニングする際には最大1.49倍の推論速度向上を達成します。また、最小限の微調整でプルーニング済みモデルを効果的に復元できることも示します。

35歳主任エンジニア、管理職か専門職かの選択に悩むキャリアの岐路に

日経XTECH

U-NetとTransformerを合体！医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介｡

AI-SCHOLAR

ビルド・イン・パブリック：AI画像SaaSを作って学んだこと

Dev.to

初心者からの「Claude AI」の学び方：ステップバイステップ入門ガイド

Dev.to

サステナビリティアプリのために自作のイベントバスを作った—OpenClawを使ったエージェント自動化で学んだこと

Dev.to

SimDiff：類似性と差分による深さプルーニング

要点

関連記事

35歳主任エンジニア、管理職か専門職かの選択に悩むキャリアの岐路に

U-NetとTransformerを合体！医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介｡

ビルド・イン・パブリック：AI画像SaaSを作って学んだこと

初心者からの「Claude AI」の学び方：ステップバイステップ入門ガイド

サステナビリティアプリのために自作のイベントバスを作った—OpenClawを使ったエージェント自動化で学んだこと

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

35歳主任エンジニア、管理職か専門職かの選択に悩む キャリアの岐路に

U-NetとTransformerを合体！医用画像セグメンテーションのための新しいネットワークSwin Unetを紹介｡

ビルド・イン・パブリック：AI画像SaaSを作って学んだこと

初心者からの「Claude AI」の学び方：ステップバイステップ入門ガイド

サステナビリティアプリのために自作のイベントバスを作った—OpenClawを使ったエージェント自動化で学んだこと

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

35歳主任エンジニア、管理職か専門職かの選択に悩むキャリアの岐路に