エッジAI向けCNN最適化手法の比較研究:早期終了(Early Exits)の役割を探る
arXiv cs.AI / 2026/4/17
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本研究は、エッジ端末上でCNNを動かすための主要な2つの戦略(静的圧縮:プルーニングと量子化、動的計算:早期終了メカニズム)を、現実的で同一の条件下で比較している。
- これまで個別に評価されがちだったアプローチ同士を、ONNXベースの推論パイプラインを実際のエッジ・ハードウェア上で動かすことで、デプロイ目線の根拠を提示している。
- 結果として、プルーニングと量子化はメモリ使用量を安定して削減する一方で、早期終了のように入力の難しさに応じて計算量を適応させることはできないことが示された。
- 早期終了メカニズムは入力適応的に推論の遅延や計算を削減でき、静的手法だけでは得られない改善を可能にする。
- 静的圧縮と早期終了を組み合わせると、推論のレイテンシとメモリ使用量を同時に下げつつ、精度の低下を最小限に抑えられることが分かった。



