マルチモーダル追跡のためのプログレッシブ・アダプテーションの学習
arXiv cs.CV / 2026/3/24
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、RGBの事前学習済みモデルをサーマル(Thermal)、深度(Depth)、イベント(Event)といったモダリティへより良く転移することを目的とした、マルチモーダル追跡のためのプログレッシブ・アダプテーション手法であるPATrackを提案する。
- 一般的なパラメータ効率の高い微調整(parameter-efficient fine-tuning)の限界に対処するために、3種類の協調型アダプタを追加する。モダリティ依存型(高周波/低周波の分解によりモダリティ内の表現を強化)、モダリティ絡み合い型(クロスアテンションを用いてモダリティ間の特徴の信頼性を向上)、および融合情報の不一致を扱うためのタスクレベルのアダプタ(予測ヘッド向け)である。
- PATrackは、単一モダリティレベル、モダリティ間相互作用レベル、予測ヘッドレベルにおけるアダプテーションを、1つの統一されたアーキテクチャ内で明示的に制御するよう設計されている。
- RGB+Thermal、RGB+Depth、RGB+Eventの追跡タスクにまたがる大規模な実験により、既存の最先端手法に対して性能向上が得られたと報告されている。
- 著者らは再現性およびさらなる実験を支援するために、公的なGitHubリポジトリを通じてコードを提供している。
