MTLSI-Net:パラメータ効率の高いマルチタスク・デンス予測のための線形セマンティック相互作用ネットワーク
arXiv cs.CV / 2026/4/3
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ハイレゾリューション特徴に対する通常の自己注意の二次的な計算コストを抑えつつ、タスク間のグローバルな相互作用を改善することを目的としたマルチタスク・デンス予測アーキテクチャ「MTLSI-Net」を提案する。
- MTLSI-Netは、共有されたグローバルなコンテキスト行列を用いた線形アテンション型の仕組みにより、線形計算量とより少ないパラメータでタスク間依存関係のモデリングを行うことを目指す。
- 主な構成要素として、(1) スケールをまたいだタスク間相互作用のためのマルチスケール・クエリ線形フュージョン・ブロック、(2) 冗長な情報をコンパクトなトークンへ圧縮するセマンティック・トークン・ディスティラ、(3) ローカル表現へグローバルなセマンティクスを注入するクロスウィンドウ統合アテンション・ブロックの3つを提案する。
- NYUDv2およびPASCAL-Contextでの実験により、最先端の性能が報告されており、マルチタスク学習における有効性(精度)と効率性(計算量/パラメータ削減)の両面を裏付けている。




