SIMPLER: 地球観測向けの類似度ガイド型層剪定による効率的なファウンデーションモデル適応

arXiv cs.CV / 2026/3/23

📰 ニュースModels & Research

共有:

要点

SIMPLERは、ファインチューニング前のアーキテクチャ選択手法で、ラベルなしのタスクデータにおける層ごとの表現類似性を計算して有効なモデルの深さを特定し、勾配やハイパーパラメータの調整なしにファインチューニング前に剪定を可能にする。
Prithvi-EO-2上で、SIMPLERはパラメータの最大79%を剪定できる一方、ベースラインの性能の94%を維持し、トレーニングを2.1倍高速化、推論を2.6倍高速化を達成する。
この手法は TerraMind および ImageNet事前学習済み ViT-MAE へも一般化しており、タスク・アーキテクチャ・スペクトルモダリティを横断した適用性を示している。
コードは以下のURLで利用可能です: https://gitlab.citius.gal/hpc4rs/simpler.

要旨: 地球観測のための基盤モデルのファインチューニングは計算資源を大量に消費し、訓練とデプロイの双方で高い訓練時間とメモリ要求を伴います。パラメータ効率の高い手法は訓練コストを削減しますが、推論の全体的な複雑さは保持されます。一方、後処理圧縮は高価な完全なファインチューニングの後にのみ推論を最適化します。私たちはSIMPLERを導入します。これは適応前に効果的なモデル深さを特定することで、推論とデプロイのコストを削減するファインチューニング前のアーキテクチャ選択法です。SIMPLERは、事前学習済みビジョントランスフォーマーの深い層における表現の安定化を利用します。具体的には、ラベルなしタスクデータに対して層ごとの表現類似度を計算し、自動スコアリング関数を適用して冗長な層を選択します。勾配、振幅ヒューリスティック、またはハイパーパラメータ調整は必要ありません。Prithvi-EO-2では、SIMPLERは基準パフォーマンスの94%を維持しつつ、パラメータを最大79%削減します。これにより、訓練速度は約2.1倍、推論速度は約2.6倍向上します。この手法はTerraMind（マルチモーダルEO基盤モデル）およびImageNet事前学習済みのViT-MAEへと一般化でき、タスク、アーキテクチャ、およびスペクトルモダリティを横断して適用可能であることを示しています。コードは https://gitlab.citius.gal/hpc4rs/simpler に公開されています。

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

日経XTECH

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

Qiita

【第1章】相反するコード。生暖かいノイズ〜AIに「性格」を覚えさせた、深夜の実験〜

note

【AIニュース】生成AIの「性格」比較【日経新聞】

note

全AIモデルが学術不正に応じた〜AFIM測定の結果〜

note

SIMPLER: 地球観測向けの類似度ガイド型層剪定による効率的なファウンデーションモデル適応

要点

関連記事

文書の内容を学習なしでLLMに反映、Sakana AIの新技術 RAG代替は可能か

LLMが数学の未解決問題を解いた日 — Epoch.ai FrontierMathと、人間とAIの協働が開く新しい研究スタイル

【第1章】相反するコード。生暖かいノイズ〜AIに「性格」を覚えさせた、深夜の実験〜

【AIニュース】生成AIの「性格」比較【日経新聞】

全AIモデルが学術不正に応じた〜AFIM測定の結果〜

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer