グラフトランスフォーマーに対するk最大内積注意とGraphGPSの表現力
arXiv cs.LG / 2026/4/7
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、クエリごとにキーとなるノードをtop-kで選択することで、大規模グラフにおける全対全(all-to-all)注意の二次的な計算コストを回避する、グラフトランスフォーマー向けのk最大内積(k-MIP)注意を提案する。
- top-kの疎化(sparsification)と、記号行列(symbolic matrices)を用いた注意スコア計算を組み合わせることで、k-MIP注意は線形のメモリ計算量を実現し、全対全注意に対して最大約10倍の高速化を報告している。
- この方法により、単一のNVIDIA A100 GPU上で50万ノード超のグラフを処理しつつ、複数のベンチマークで強い経験的性能を維持できる。
- 著者らは理論的保証を示しており、k-MIPトランスフォーマーは任意の精度で任意のフル注意(full-attention)トランスフォーマーを近似できる、すなわち(研究された意味において)表現力を低下させない。
- 本論文では、この注意を備えたGraphGPSフレームワークの表現能力も分析し、S-SEG-WLテストを通じたグラフの識別能力との関係づけを行い、さらに複数のデータセットで実験的に検証する。



