ImageHD:超次元計算による視覚表現の省エネ・オンデバイス継続学習をFPGAで実現

arXiv cs.CV / 2026/4/24

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • ImageHDは、非定常データストリームを扱うオンデバイス継続学習を、超次元計算(HDC)で低計算量・低メモリ負荷に実現するFPGAベースの新しいシステムである。
  • 既存手法のバックプロパゲーションを避け、統一された“上限付き”のエピソードメモリと、ハードウェア効率の高いクラスタ統合戦略により、エピソード/メモリの複雑さを抑えている。
  • ImageHDは、量子化CNN特徴抽出器とHDCエンコード、類似度検索、上限付きクラスタ管理を組み合わせ、AMD Zynq ZCU104 FPGA上でストリーミング・データフローとして実装している。
  • 計算資源が厳しいオンチップ制約下でも高並列なビット演算を可能にするため、ワード詰めのバイナリ・ハイパーベクトルを用いている。
  • CORe50で、最適化済みCPU(GPU)比で最大40.4×(4.84×)の高速化と、最大383×(105.1×)のエネルギー効率向上を報告し、リアルタイム向けエッジ展開の実用性を示している。

要旨: オンデバイス連続学習(CL)は、非定常なデータストリーム上で動作するエッジAIシステムにとって重要ですが、既存の多くの手法は逆伝播や、実例(エキソンプラ)を多く保持する分類器に依存しており、計算量・メモリ・レイテンシの大きなオーバーヘッドが生じます。高次元コンピューティング(HDC)は、高速で反復を伴わないオンライン更新によって、軽量な代替手段を提供します。コンパクトな畳み込みニューラルネットワーク(CNN)特徴抽出器と組み合わせることで、強力な視覚表現を備えた効率的なオンデバイス適応を実現できます。しかし、先行するHDCベースのCLシステムの多くは、複数段のメモリ階層や複雑なクラスタ管理に依存しており、リソースの限られたハードウェアへの展開可能性を制約しています。
本稿では、HDCに基づく視覚データのオンデバイス連続学習のためのFPGAアクセラレータであるImageHDを提案します。ImageHDは、厳しいレイテンシ制約とオンチップメモリ制約の下でのストリーミングCLを対象とし、高コストな反復最適化を回避します。アルゴリズムの観点では、ハードウェアを考慮したCL手法として、統一された実例メモリによりクラスの実例を上限付きで管理し、さらにハードウェア効率の高いクラスタ統合戦略を導入します。また、量子化されたCNNフロントエンドを取り入れることで、精度を損なうことなくデプロイメントのオーバーヘッドを削減します。システムの観点では、ImageHDはAMD Zynq ZCU104 FPGA上でストリーミング・データフローアーキテクチャとして実装され、HDCエンコード、類似度検索、さらにワードパックされた2値ハイパーベクトルを用いた上限付きクラスタ管理を統合します。これにより、タイトなオンチップ資源予算の範囲内で、大規模な並列ビット演算を可能にします。CORe50において、ImageHDは最適化されたCPU(GPU)ベースラインに対し最大40.4x(4.84x)の高速化と383x(105.1x)のエネルギー効率を達成し、リアルタイムなエッジAIに対するHDCを用いた連続学習の実用性を示しています。