二次を超えて:RWKVによる線形時間の変化検出

arXiv cs.CV / 2026/3/23

📰 ニュースSignals & Early TrendsModels & Research

要点

  • ChangeRWKVは、変化検出用のRWKVフレームワークを基盤とすることで、RNNライクな推論の効率とTransformerスタイルのトレーニングを両立させる。
  • 多解像度の特徴を捉える階層型RWKVエンコーダと、スケールを跨ぐ空間情報を整合させ、時間的変化を蒸留する空間-時間融合モジュールを備える。
  • LEVIR-CDベンチマークでIoU 85.46%、F1スコア92.16%の最先端性能を達成し、従来手法と比較してパラメータとFLOPsを削減する。
  • コードとモデルは公開されており、採用とさらなる研究を可能にする。

要約: 既存のリモートセンシングの変化検出パラダイムは、トレードオフにはまっている。CNNは効率性に優れる一方で全体的な文脈を欠く。 一方、Transformersは長距離依存性を捉えるが、計算コストが高すぎる。本論文はこの対立を和解させる新しいアーキテクチャ、ChangeRWKVを提案する。Receptance Weighted Key Value (RWKV) フレームワークを基盤として、ChangeRWKVはTransformersの並列トレーニングとRNNの線形時間推論を独自に組み合わせる。我々のアプローチの中核特徴は2つの主要なイノベーションだ。階層的RWKVエンコーダはマルチ解像度の特徴表現を構築し、Spatial-Temporal Fusion Module (STFM) はスケール間の空間的不整合を解消しつつ、細かな時間的差異を蒸留する新規設計である。ChangeRWKVはLEVIR-CDベンチマークにおいて最先端の性能を達成し、IoUは85.46%、F1スコアは92.16%を記録するだけでなく、従来の先行手法と比較してパラメータ数と FLOPs を大幅に削減する。本研究は、運用規模の変化検出に対する新しく、効率的で、強力なパラダイムを示す。我々のコードとモデルは公開されています。