独自コモン分解を用いた結合辞書アンフォールディングネットワークと勾配適応フィデリティによる転移可能なマルチソース融合
arXiv cs.CV / 2026/5/4
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、リソース制約のあるエッジデバイスでの利用を見据えた、軽量なCDNet(Combined Dictionary Unfolding Network)によるマルチソース画像融合を提案している。
- 既存の多くの深層アンフォールディング手法がモダリティごとに別々に特徴を更新する交互最小化に基づくのに対し、CDNetは結合辞書学習の「独自・共通分解」事前分布を構造的に制約した共同アンフォールディングへと翻訳している。
- CDNetのCDBlockはブロックスパースな相互作用トポロジを用い、共通表現とモダリティ固有表現をモデル由来で同時に更新することで、計算量とメモリ負荷を抑えつつ学習効率を高めている。
- 教師となる正解画像なしでの教師なし学習を可能にするために、「高周波・低周波の画像フィデリティ損失」をコンパクトに設計している。
- 4つの融合タスク(多重露光、赤外・可視、医療、赤外・可視のセマンティックセグメンテーション)で評価した結果、競争力またはそれ以上の性能が示され、特にPSNRでTNOが1.23 dB、RoadSceneが1.59 dB(2番手比)の向上が報告されている。



