CollideNet:衝突までの時間(TTC)予測のための、分離を伴う階層的マルチスケール動画表現学習
arXiv cs.CV / 2026/4/20
📰 ニュースTools & Practical UsageModels & Research
要点
- 本論文では、動画から衝突までの時間(TTC)を予測するための階層型・時空間トランスフォーマー構成「CollideNet」を提案している。
- CollideNetは、空間ストリームで各フレームの情報を複数解像度で集約し、時間ストリームでマルチスケール特徴を符号化する。
- 時間側のモデリングでは、非定常性・トレンド・季節性の成分を分離し、時間変化するダイナミクスの捉え方を改善している。
- 3つの公開データセットで従来手法を大きく上回る状態最先端(SOTA)性能を報告し、再現性のためのコードも公開している。
- 分布の異なるデータセット間での評価や可視化により、汎化性能とトレンド/季節性分離の効果を分析している。



