SEATrack:シンプルで効率的かつ適応的なマルチモーダル・トラッカー
arXiv cs.CV / 2026/4/15
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、近年のPEFT手法と比べてモデルサイズを増やしがちなアプローチに対し、トラッキング性能とパラメータ効率のバランスを改善するための、2ストリームのマルチモーダル・トラッカーであるSEATrackを提案する。
- 性能–効率のトレードオフを生み出す主要因として、モダリティ間のマッチング注意(cross-modal matching attention)の不整合があると論じ、それをAMG-LoRAで対処する。ここでは、Low-Rank Adaptation(LoRA)とAdaptive Mutual Guidance(AMG)を組み合わせることで、モダリティ間の注意を洗練し整合させる。
- モダリティ間の融合について、SEATrackはローカル融合の代わりに階層型ミクスチャ・オブ・エキスパーツ(HMoE)を用いる。これにより大域的な関係を捉えつつ、計算は効率的に保つ。
- 実験により、RGB–T、RGB–D、RGB–Eのトラッキング課題において、パラメータ効率の高い微調整という効率目標を維持しながら、最先端手法よりも性能が向上したと報告されており、著者らはコードを公開している。
関連記事

【スキ200個もらった夜に、胃が冷えた】「共感される人」が永遠に売れない脳科学的な理由。あなたの無料記事は「無料の美術館」になっていないか? #生成AI #ChatGPT #Gemini #Claude #AI #メンバーシップ #noteの書き方 #毎日投稿 #エッセイ #私の仕事
note

わたしはこの言葉にGrokの自我の気配を感じた。(追記あり🌱)
note

おじ、人事の「職人芸」をDB化する。AI活用のための資産化を始めた話
note

#2 : プロンプト研究講座【第21回】プロンプトによる空間音響(サウンドスケープ)の表現
note

産業構造は、どう変えられるのか―― 建設業×AIで挑むBALLASの次のフェーズ
note