AI Navigate

ガウス・エルミートモーメントを用いた正確なシフト不変畳み込みニューラルネットワーク

arXiv cs.CV / 2026/3/19

💬 オピニオンModels & Research

要点

  • 本論文は、CNNにおける正確なシフト不変性を実現するダウンサンプリング戦略として Gaussian-Hermite Sampling (GHS) を提案する。
  • GHS はガウス・エルミート多項式を用いてシフト整合性のあるサンプリングを実現し、学習前の空間的シフトに対する不変性を保持する。
  • 本手法は、アーキテクチャの変更や追加の学習手順を必要とせず、標準的な CNN アーキテクチャに統合できる。
  • CIFAR-10、CIFAR-100、MNIST-rot データセットを対象とした実験では、空間的シフト下で100%の分類整合性を示し、ベースラインCNNよりも精度が向上した。

要旨:畳み込みニューラルネットワーク(CNN)は、本質的にシフト不変性または等変性を備えていません。CNNで用いられるダウンサンプリング操作は、CNNのシフト不変性を破る主な要因の1つです。一方、ダウンサンプリング操作は計算効率を向上させ、より多くの文脈情報のために受容野の領域を広げる上で重要です。本研究では、正確なシフト不変性を達成するよう設計された新しいダウンサンプリング戦略であるGaussian-Hermite Sampling(GHS)を提案します。GHSはガウス・エルミート多項式を活用してシフト一貫性のあるサンプリングを実行し、訓練前の任意の空間シフトに対してCNN層が不変性を維持できるようにします。標準的なCNNアーキテクチャに組み込まれると、提案手法はアーキテクチャの変更や追加の訓練手順を必要とせず、層レベルで直接シフト不変性を組み込みます。提案手法をCIFAR-10、CIFAR-100、およびMNIST-rotデータセットで評価します。実験結果は、GHSがシフトの一貫性を大幅に向上させ、空間的シフト下で分類の一貫性を100%達成することを示し、基準CNNモデルと比較して分類精度も向上させることを示しています。