グラフ信号処理はMamba2と出会う:デルタ変調による適応型フィルタバンク

arXiv cs.AI / 2026/3/25

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ライン(線形)グラフ上の適応型フィルタバンクとして、Mamba2の状態空間モデルをグラフ信号処理(GSP)に触発された形で再解釈したHADESを提案する。
  • HADESは、デルタパラメータ(Δ)に対する構造化されたバイアスによって制御される階層的なフィルタ設計を追加し、共有フィルタでグローバルなローパスの傾向を捉え、専門(エキスパート)フィルタで局所的なハイパス挙動を扱う。
  • 著者らは、HADESが言語モデリング、常識推論、長期コンテキストの検索といった複数のタスクで、(Mamba2を含む)ベースライン性能に一致すると報告している。
  • HADESは、元のパラメータの58.9%のみでこれを達成したとされており、ベンチマーク品質を損なわずに効率を改善することを目指している。
  • 本研究は、SSMベースのアーキテクチャ内で、より効率的かつ解釈可能なフィルタリングの視点を提供することで、GSPとニューラルなシーケンスモデリングを架橋すると主張している。

Abstract

状態空間モデル(SSM)は、線形時間の再帰によって注意機構に対する効率的な代替手法を提供します。近年のSSMベースの言語モデルであるMamba2は、選択的な入力ゲーティングとマルチヘッド構造を用い、並列計算と強力なベンチマーク性能を可能にします。しかし、そのマルチヘッド再帰は独立に動作しており、構造化された利用や解析が行われていません。本研究では、効率的なSSMのための階層型ADaptiveフィルタバンク(Hierarchical ADaptive filter bank for Efficient SSMs: HADES)と呼ぶ新しい手法を提案します。HADESは、グラフ信号処理(GSP)に着想を得た枠組みであり、Mamba2を線グラフ上の適応フィルタバンクとして再解釈します。階層アーキテクチャは、パラメータ{ Delta}への構造化されたバイアスによって実現される、グローバルなローパス挙動のための共有フィルタと、ローカルなハイパス挙動のためのエキスパートフィルタの2種類のフィルタを導入します。HADESは、言語モデリング、常識推論、長文脈のリトリーバルといったさまざまなベンチマークにおいて、Mamba2を含むベースラインモデルと同等の性能を達成しつつ、元のパラメータの58.9%のみを使用します。これにより、HADESはGSPとニューラルシーケンスモデリングを橋渡しし、状態空間モデル内において効率的で階層的かつ解釈可能なフィルタリングを実現します。