要約: 航空災害監視やインフラ点検などのタスクのために、組み込みデバイス上でディープラーニングモデルを展開するには、モデルサイズ、メモリ、レイテンシに関する厳しい制約と精度のバランスを取る設計が求められます。本論文は、埋め込み画像分類のために SqueezeNet のファイアモジュールをゲート付き多層パーセプトロン(gMLP)ブロックに置き換えた軽量CNNアーキテクチャ VeloxNet を紹介します。各 gMLP ブロックは、学習された空間投影と乗算ゲーティングを適用する空間ゲートユニット(SGU)を使用し、単一の層で全特徴マップ全体の空間的依存性を捉えることを可能にします。ファイアモジュールは小さな畳み込みカーネルによって定義される局所受容野に限られますが、SGU は各層でより少ないパラメータでグローバルな空間モデリングを提供します。VeloxNet を以下の3つの航空画像データセットで評価します:緊急対応用航空画像データベース(AIDER)、総合災害データセット(CDD)、堤防欠陥データセット(LDD)、MobileNet 系、ShuffleNet、EfficientNet、最近のビジョントランスフォーマーを含む11のベースラインと比較します。VeloxNet は SqueezeNet に比べてパラメータ数を 46.1% 減らし(740,970 から 399,366 へ)、AIDER で加重 F1 スコアを 6.32%、CDD で 30.83%、LDD で 2.51% 向上させます。これらの結果は、局所的な畳み込みモジュールを空間ゲーティングブロックに置換することが、リソース制約下のデプロイメントにおいて、分類精度とパラメータ効率の双方を改善できることを示しています。論文が受理され次第、ソースコードを公開します。
VeloxNet: 軽量組み込み画像分類のための効率的な空間ゲーティング
arXiv cs.CV / 2026/3/23
📰 ニュースModels & Research
要点
- VeloxNetはSqueezeNetのファイアモジュールを置換する空間ゲーティングユニットを備えたゲーティッド・マルチレイヤー・パーセプトロンブロックを導入し、パラメータ数を抑えつつ組み込み画像分類におけるグローバルな空間モデリングを可能にする。
- 本モデルはSqueezeNetと比較してパラメータ数を46.1%削減(740,970から399,366へ)し、AIDER、CDD、LDDの加重F1スコアをそれぞれ6.32%、30.83%、2.51%向上させた。
- MobileNet系の派生モデル、ShuffleNet、EfficientNet、最近のビジョン・トランスフォーマーを含む11件のベースラインとの比較評価は、リソース制約下におけるVeloxNetの効率性と精度向上を示している。
- 著者らは、論文が採択され次第、ソースコードを公開する予定であり、再現性と実践的な導入を可能にする。

