LiFR-Seg:イベント誘導による伝播で実現する、いつでも行える高フレームレート意味セグメンテーション
arXiv cs.CV / 2026/3/24
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- LiFR-Segは、「Anytime Interframe Semantic Segmentation(いつでも任意時刻のフレーム間意味セグメンテーション)」を導入し、低フレームレート(LFR)動画に依存せずに、1枚の過去RGBフレームと非同期のイベントカメラデータのみで任意の時刻における高密度セグメンテーションを可能にする。
- 提案手法は、不確実性を考慮したワーピング(ゆがみ)プロセスを通じて、イベントから導出したモーション場と学習された信頼度を駆使し、高ダイナミックなシーンでの特徴劣化を抑えることで、時間方向に深い意味特徴を伝播させる。
- 時間方向のメモリ注意(テンポラル・メモリ・アテンション)モジュールを用いることで、特に動きやシーン変化がある場合でも、時間を通じた意味的一貫性を維持する。
- DSECデータセットでの実験(73.82% mIoU)および新しい高周波合成ベンチマーク(SHF-DSEC)により、LFRベースの性能が統計的にHFRの上限に近いことが示される(0.09%以内)。
