ViSAGE @ NTIRE 2026 Challenge on Video Saliency Prediction
arXiv cs.CV / 4/13/2026
📰 NewsSignals & Early TrendsModels & Research
Key Points
- ViSAGE(Video Saliency with Adaptive Gated Experts)は、NTIRE 2026のVideo Saliency Predictionチャレンジ向けに提案されたマルチエキスパート・アンサンブル手法です。
- 専用のデコーダごとに適応的なゲーティングとモジュレーションを行い、動画の時空間特徴を段階的に洗練していく設計です。
- 複数エキスパートの予測を推論時に融合することで、相補的な帰納バイアスを集約し、複雑な注目(サリエンシー)手がかりを捉えることを狙います。
- プライベートテストでは4指標中2指標で1位、他2指標でも多くの競合を上回り、汎化性能の高さを示したと報告されています。
- 実装コードは指定GitHubリポジトリで公開されています。
Related Articles

Black Hat Asia
AI Business

Apple is building smart glasses without a display to serve as an AI wearable
THE DECODER

Why Fashion Trend Prediction Isn’t Enough Without Generative AI
Dev.to

Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.
Dev.to

วิธีใช้ AI ทำ SEO ให้เว็บติดอันดับ Google (2026)
Dev.to