要旨: 合成開口レーダー(SAR)画像認識は、災害監視、防衛偵察、海洋観測において重要です。しかし、大規模なSAR画像サイズは、計算資源が制約されたエッジデバイスへの深層学習の導入を妨げており、既存の軽量モデルでは、高精度な特徴抽出と低い計算要求との両立が難しいという課題があります。新たに登場したコルモゴロフ=アーノルド・ネットワーク(KAN)は、固定された活性化関数を学習可能なものに置き換えることで近似(フィッティング)を強化し、パラメータ数と計算量を削減します。KANに着想を得て、精度と効率のより良いバランスを実現するためにLight-ResKANを提案します。第一に、Light-ResKANはResNetを改変し、畳み込みをKAN畳み込みに置き換えることで、SAR画像に対する適応的な特徴抽出を可能にします。第二に、活性化関数としてグラム多項式を用います。これはSARデータに適しており、複雑な非線形関係を捉えることができます。第三に、パラメータ共有戦略を採用します。各カーネルはチャネルごとにパラメータを共有し、独自の特徴を保ちながら、パラメータ数とFLOPsを削減します。本モデルは、MSTAR、FUSAR-Ship、SAR-ACDデータセットにおいて、それぞれ99.09%、93.01%、97.26%の精度を達成します。1024 \times 1024にリサイズしたMSTARでの実験では、VGG16と比較して、当モデルはFLOPsを82.90 \times削減し、パラメータ数を163.78 \times削減します。本研究は、エッジにおけるSAR画像認識のための効率的な解決策を確立します。
Light-ResKAN:効率的なSAR画像認識のためのグラム多項式によるパラメータ共有型軽量KAN
arXiv cs.CV / 2026/4/3
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、リソースが限られたエッジデバイス上での合成開口レーダ(SAR)画像認識向けに設計された、軽量なコルモゴロフ=アルノルド・ネットワーク(KAN)に着想を得たモデルであるLight-ResKANを提案する。
- Light-ResKANはResNetの畳み込みをKAN畳み込みに置き換えることで、より適応的な特徴抽出を可能にし、活性化関数としてグラム多項式を用いて、SAR固有の複雑な非線形関係をモデル化する。
- パラメータ共有戦略によりカーネルのパラメータをチャネルごとに共有し、識別的なチャネル固有の特徴を保持しつつ、パラメータ数とFLOPsを大幅に削減することを狙う。
- 複数のSARベンチマークで高い精度を報告しており(MSTARで99.09%、FUSAR-Shipで93.01%、SAR-ACDで97.26%)、さらにリサイズしたMSTARにおいてVGG16に対しFLOPsを82.90倍少なく、パラメータを163.78倍少なくするなど、顕著な効率改善を示す。
- 全体として、本研究は災害監視、偵察、海洋観測といった用途に向けて、計算量との精度のトレードオフを狙う、エッジ展開可能なアーキテクチャを提案する。




