FreqTrack:RGB-イベント物体追跡のための周波数学習ベース ビジョントランスフォーマー
arXiv cs.CV / 2026/4/17
📰 ニュースModels & Research
要点
- 従来のRGBのみのビジュアル追跡は複雑で動的なシーンで性能が頭打ちになりやすく、イベントセンサー導入で改善の余地はあるものの、多くのRGB-イベント融合手法はイベントデータの時間応答や高周波特性を十分に活用できていない。
- 本論文では、周波数領域で変換してモダリティ間の相補的な相関を作ることで、より頑健な特徴融合を可能にする周波数認識型のRGB-イベント追跡フレームワーク「FreqTrack」を提案する。
- Spectral Enhancement Transformer(SET)層として、多ヘッドのダイナミック・フーリエ・フィルタリングを用い、周波数領域の特徴を状況に応じて強調・選択する仕組みを導入する。
- Wavelet Edge Refinement(WER)モジュールでは、学習可能なウェーブレット変換によりイベントデータから多尺度のエッジ構造を明示的に抽出し、高速・低照度条件でのモデリング能力を高める。
- COESOTおよびFE108での実験では競争力のある結果が得られ、COESOTベンチマークで精度76.6%の首位を達成し、RGBE追跡における周波数領域モデリングの有効性を裏付けている。




