交通監視ビデオにおける事故検出・位置特定・分類のためのモジュール化されたゼロショット・パイプライン
arXiv cs.CV / 2026/4/14
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 提案手法は、ACCIDENT @ CVPR 2026向けに「事故がいつ起きたか(時間)」「どこで起きたか(位置)」「どのタイプか(分類)」を、ラベル付き実データなしで推定するゼロショット・パイプラインとして構成されている。
- パイプラインは3モジュールに分離され、(1)正規化したフレーム差分のピーク検出で衝突時刻を特定し、(2)Farneback光学フローの密度を積算して重み付き重心で影響位置を推定し、(3)事故種別はCLIP画像埋め込みとカテゴリを表すマルチプロンプトのテキスト埋め込みのコサイン類似度で分類する。
- 特定ドメインへの微調整を行わず、事前学習済み重みのみを用いて各動画を処理する点が特徴である。
- 実装はKaggleノートブックとして公開されており、検証・再現が容易な形で提供されている。




