ガウス・エルミートモーメントを用いた正確なシフト不変畳み込みニューラルネットワーク

arXiv cs.CV / 2026/3/19

💬 オピニオンModels & Research

共有:

要点

本論文は、CNNにおける正確なシフト不変性を実現するダウンサンプリング戦略として Gaussian-Hermite Sampling (GHS) を提案する。
GHS はガウス・エルミート多項式を用いてシフト整合性のあるサンプリングを実現し、学習前の空間的シフトに対する不変性を保持する。
本手法は、アーキテクチャの変更や追加の学習手順を必要とせず、標準的な CNN アーキテクチャに統合できる。
CIFAR-10、CIFAR-100、MNIST-rot データセットを対象とした実験では、空間的シフト下で100％の分類整合性を示し、ベースラインCNNよりも精度が向上した。

要旨：畳み込みニューラルネットワーク（CNN）は、本質的にシフト不変性または等変性を備えていません。CNNで用いられるダウンサンプリング操作は、CNNのシフト不変性を破る主な要因の1つです。一方、ダウンサンプリング操作は計算効率を向上させ、より多くの文脈情報のために受容野の領域を広げる上で重要です。本研究では、正確なシフト不変性を達成するよう設計された新しいダウンサンプリング戦略であるGaussian-Hermite Sampling（GHS）を提案します。GHSはガウス・エルミート多項式を活用してシフト一貫性のあるサンプリングを実行し、訓練前の任意の空間シフトに対してCNN層が不変性を維持できるようにします。標準的なCNNアーキテクチャに組み込まれると、提案手法はアーキテクチャの変更や追加の訓練手順を必要とせず、層レベルで直接シフト不変性を組み込みます。提案手法をCIFAR-10、CIFAR-100、およびMNIST-rotデータセットで評価します。実験結果は、GHSがシフトの一貫性を大幅に向上させ、空間的シフト下で分類の一貫性を100%達成することを示し、基準CNNモデルと比較して分類精度も向上させることを示しています。

仕様駆動開発における自己改良エージェント

Dev.to

誰かこれを試したことはありますか？ Flash-MoE: ノートパソコンで3,970億パラメータのモデルを動かす

Reddit r/LocalLLaMA

M2.7のオープンウェイト、約2週間で公開予定

Reddit r/LocalLLaMA

MiniMax M2.7 ウェイト公開予定

Reddit r/LocalLLaMA

Claude Codeに最適なオープンソースのコーディングモデルは？LB?

Reddit r/LocalLLaMA

ガウス・エルミートモーメントを用いた正確なシフト不変畳み込みニューラルネットワーク

要点

関連記事

仕様駆動開発における自己改良エージェント

誰かこれを試したことはありますか？ Flash-MoE: ノートパソコンで3,970億パラメータのモデルを動かす

M2.7のオープンウェイト、約2週間で公開予定

MiniMax M2.7 ウェイト公開予定

Claude Codeに最適なオープンソースのコーディングモデルは？LB?

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer