Beyond Mamba: 可変(deformable)な拡張畳み込みでステート空間モデルを強化し、多尺度の交通物体検出を実現
arXiv cs.CV / 2026/4/10
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、小さな物体が散乱したシーンにおける困難さを対象とした、多尺度交通物体検出のためのMambaベースモデル「MDDCNet」を提案する。
- 階層的な多尺度可変拡張畳み込み(MSDDC)ブロックとMambaブロックを組み合わせることで、局所的な詳細と大域的な意味の双方をより適切に捉えるように、ステート空間モデリングを強化する。
- チャネル間の相互作用を改善するために、Channel-Enhanced Feed-Forward Network(CE-FFN)を導入し、従来のFFNの限界に対処する。
- より強力なクロススケール融合のために、MambaベースのAttention-Aggregating Feature Pyramid Network(A^2FPN)を用いて、多尺度特徴の集約を改善する。
- 公開ベンチマークおよび実世界データセットでの実験により、MDDCNetが複数の先進的検出器を上回ることが報告されており、著者はGitHubでコードも提供している。


