AI Navigate

CNN向けの調整可能な誤差許容を備えたハードウェア効率の高い近似畳み込み

arXiv cs.AI / 2026/3/12

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep Analysis

要点

  • 本論文は、CNNにおける顕著でない非零乗算をスキップするために、ハードウェア効率の高いMSBプロキシを用いた『ソフトスパース性』というパラダイムを提案する。
  • カスタムRISC-V命令として実装され、LeNet-5(MNIST)で評価されたこの手法は、ReLU MACsを88.42%、Tanh MACsを74.87%削減し、精度損失ゼロを達成—ゼロスキップを約5倍上回る。
  • 非活性の乗算器のクロックゲーティングにより、ReLUで35.2%、Tanhで29.96%の電力削減を見込むが、メモリアクセスにより全体の電力削減は演算削減に対してサブリニアになる。
  • この結果は、より効率的なエッジ推論の大きな可能性を示しており、リソース制約下の展開のための今後のCNNアクセラレータおよびハードウェア設計に影響を与える可能性がある。
本文: arXiv:2603.10100v1 アナウンス種別: cross Abstract: 現代のCNNは高い計算要求によりエッジ実装を妨げており、伝統的な「ハード」スパース性(数学的ゼロのスキップ)は深い層やTanhのような滑らかな活性化関数には有効性を失う。私たちは、ハードウェア効率の良いMSB(Most Significant Bit)プロキシを用いた「ソフトスパース性」パラダイムを提案する。カスタムRISC-V命令として統合され、LeNet-5(MNIST)で評価されたこの手法は、ReLUのMACを88.42%、TanhのMACを74.87%削減し、精度損失ゼロを達成—ゼロスキップを約5倍上回る。非活性の乗算器をクロックゲートすることにより、ReLUで35.2%、Tanhで29.96%の電力削減を見込む。メモリアクセスが演算削減に対して電力削減をサブリニアにする一方で、このアプローチはリソース制約下の推論を大幅に最適化する。