ランダム拡張畳み込みとマルチブランチ特徴抽出、文脈励起による画像分類
arXiv cs.CV / 2026/4/29
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この論文では、ResNet-34をベースにした画像分類ネットワークRDCNetを提案し、微細な特徴抽出の強化と背景ノイズの抑制、過学習の低減を同時に目指します。
- RDCNetの中核であるMRDCモジュールは、異なる拡張率(dilation rate)を持つ複数ブランチのランダム拡張畳み込みと確率的マスキングを組み合わせ、マルチスケールの詳細を頑健に捉えます。
- Fine-Grained Feature Enhancement(FGFE)モジュールは、適応プーリングと双一次補間により大域コンテキストを局所特徴へ橋渡しし、微妙な視覚パターンへの感度を高めます。
- Context Excitation(CE)モジュールは、ソフトマックスに基づく空間注意とチャネル再調整によって、タスクに関連する領域を強調し背景の干渉を抑えます。
- CIFAR-10/100、SVHN、Imagenette、Imagewoofの各データセットで実験を行い、いずれも最先端の精度を達成し、データセットに応じて2番手手法を最大で数ポイント上回ります。



