GraphLeap:グラフ構築と畳み込み(メッセージパッシング)を分離して、FPGA上でVision GNNを高速化

arXiv cs.CV / 2026/4/24

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • Vision Graph Neural Networks(ViG)は、各層でパッチトークンの特徴に基づいてkNNにより特徴依存グラフを構築し、その上でメッセージパッシングを行うが、層ごとのグラフ構築がボトルネックであり、CPU/GPU上で畳み込み時間の50〜95%を占め、O(N^2)でスケールする。
  • GraphLeapは、グラフ構築と特徴更新の逐次依存を解消するために、ワンレイヤ先読みで「前層の特徴で現層のメッセージパッシングを実行」しつつ「同時に現層の特徴で次層のグラフを構築」するように分離する。
  • 前層の特徴を使うことによる精度低下は小さいとされており、数エポックの軽量なファインチューニングで元の精度を回復できる。
  • GraphLeapを基に、Vision GNN向けのエンドツーエンドFPGAアクセラレータを初めて提示し、ストリーミングかつ層パイプライン設計でkNNグラフ構築と特徴更新をオーバーラップし、Alveo U280 FPGAで最大95.7×(CPU比)/8.5×(GPU比)の高速化を達成する。
  • 明示的なエッジ特徴のマテリアライズを避ける効率的なオンチップデータフロー設計などにより、リアルタイムなVision GNN推論の実現可能性が示されている。