限られたデータでの画像分類に向けたカオスCNNの提案

arXiv cs.CV / 2026/4/17

📰 ニュースTools & Practical UsageModels & Research

要点

  • この論文では、モデルの複雑さを増やさずに、限られた学習データ下でのCNNの汎化性能を高めるためのカオスに基づく非線形特徴変換を提案しています。
  • ロジスティック、スキュー・テン(skew tent)、サインの写像を用いて正規化した特徴ベクトルを、分類層の手前で変換し、特徴空間を再構成してクラス分離性を向上させます。
  • MNIST、Fashion-MNIST、CIFAR-10でCNNの深さを変えて評価したところ、全データセットでスタンドアロンCNNより一貫した改善が見られました。
  • 報告されている最大の改善幅は、MNISTで+5.43%(skew tent map、3層CNN、1クラスあたり40サンプル)、Fashion-MNISTで+9.11%(sine map、3層CNN、1クラスあたり50サンプル)、CIFAR-10で+7.47%(skew tent map、1クラスあたり200サンプル)です。
  • 本手法は計算効率が高く追加の学習可能パラメータを必要とせず、既存のCNNに容易に組み込めるため、データ不足の画像分類に実用的です。

Abstract

畳み込みニューラルネットワーク(CNN)は、過学習や特徴の多様性の不足により、限られた学習データの状況では汎化性能が低いことが多い。本研究では、モデルの複雑さを増やすことなくCNNの性能を高めるための、シンプルで効果的なカオスに基づく特徴変換を提案する。この手法は、分類層の前に正規化された特徴ベクトルへ、ロジスティック写像、スキュー・テン ト写像、そしてサイン写像を用いた非線形変換を適用し、それによって特徴空間を再形成してクラスの分離性を向上させる。提案手法は、限られたデータ条件下で、深さの異なるCNNアーキテクチャを用いて、グレースケールのデータセット(MNISTおよびFashion-MNIST)とRGBデータセット(CIFAR-10)で評価する。その結果、すべてのデータセットにおいて、単独CNN(SA)に対する一貫した改善が示された。特に、MNISTでは、クラスあたり40サンプルの条件で3層CNNとスキュー・テン ト写像を用いることで、最大の性能向上5.43%が達成される。Fashion-MNISTでは、クラスあたり50サンプルの条件で3層CNNとサイン写像を用いることで、9.11%の高い向上が観測される。さらにCIFAR-10では、クラスあたり200サンプルの条件でスキュー・テント写像を用いることで、7.47%の強い向上が得られる。異なるカオス写像にわたって一貫した改善が見られることは、この性能向上がカオス系の共有される非線形的および動力学的な特性によって駆動されていることを示唆している。提案手法は計算効率が高く、追加の学習可能パラメータを必要とせず、既存のCNNアーキテクチャへ容易に統合できるため、データが乏しい画像分類タスクに対する実用的な解決策となる。