CNNベースのセマンティックセグメンテーションにおける疎なミクスチャ・オブ・エキスパート層の設計と挙動

arXiv cs.CV / 2026/4/16

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、細粒度のフィルタ/チャネルに基づくMoE設計ではなく、より粗いパッチ単位のルーティング戦略を用いて、疎なミクスチャ・オブ・エキスパート(MoE)層をCNNベースのセマンティックセグメンテーションへ統合する方法を検討する。
  • CityscapesおよびBDD100Kに対する実験(エンコーダ・デコーダ型およびバックボーンベースのCNN)により、アーキテクチャ上の選択がルーティングのダイナミクスとエキスパートの専門化に与える影響を分析する。
  • 結果として、計算コストの追加がほとんどない状態で、アーキテクチャに依存したセグメンテーション品質の改善が最大+3.9 mIoU一貫して得られる。
  • 著者らは、設計上の意思決定に対する強い感度を見出しており、CNNによる高密度予測における疎なMoEの性能は、層/ルーティング構成に大きく依存することを示している。
  • 本論文は、MoE層をCNNセグメンテーション・パイプラインに組み込むためのさらなる検証を支援するための実証的知見を提供し、GitHubでコードを公開している。