Hero-Mamba:Mambaベースのデュアルドメイン学習による水中画像強調

arXiv cs.CV / 2026/4/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 水中画像は、光の吸収と散乱により色の歪み、低コントラスト、ディテールのぼかしといった深刻な劣化を起こし、既存のCNNやTransformerでは効率よく対処しにくいという課題があります。
  • Hero-Mambaは、空間(RGB)ドメインとスペクトル(FFT)ドメインの情報を並列に処理するMambaベースのデュアルドメイン学習フレームワークを提案し、劣化要因の分離を可能にします。
  • MambaベースのSS2Dブロックは、長距離依存や大域的受容野を、線形計算量で捉えることで、高解像度入力に対するTransformerの二次的な計算コストの問題を解決します。
  • 背景光の事前知識に導かれるColorFusionブロックにより、水中の色情報を高い忠実度で復元することを狙っています。
  • LSUIおよびUIEBベンチマークでの実験では、Hero-Mambaが既存の最先端手法を上回り、LSUIでPSNR 25.802、SSIM 0.913を達成しています。

Abstract

海中画像は、水中での光の吸収および散乱により、色の歪み、低コントラスト、ぼやけたディテールなど、しばしば深刻な劣化を受けます。CNNやTransformerのような学習ベースの手法は有望性を示しているものの、重要な限界があります。すなわち、CNNは非一様な劣化に必要な長距離依存関係をモデル化するのが難しく、Transformerは計算量が二次的であるため、高解像度画像では効率が悪くなります。これらの課題に対処するため、私たちは、水中画像強調のための効率的なデュアルドメイン学習を実現する、新しいMambaベースのネットワークであるHero-Mambaを提案します。私たちのアプローチは、空間ドメイン(RGB画像)とスペクトルドメイン(FFT成分)という、2つの情報を並列に独自の方法で処理します。このデュアルドメイン入力により、ネットワークは劣化要因をデカップリングし、色/明るさの情報と、テクスチャ/ノイズを分離できます。ネットワークの中核では、MambaベースのSS2Dブロックを用いて、線形計算量で大域的な受容野と長距離依存関係を捉えます。これにより、CNNとTransformerの双方の限界を克服します。さらに、背景光の事前知識に導かれたColorFusionブロックを導入し、高い忠実度で色情報を復元します。LSUIおよびUIEBのベンチマークデータセットに対する大規模な実験により、Hero-Mambaが最先端手法を上回ることを示します。特に、当モデルはLSUIでPSNR 25.802、SSIM 0.913を達成しており、優れた性能と汎化能力を裏付けています。