HQF-Net:リモートセンシング画像セグメンテーションのためのハイブリッド量子-古典マルチスケール融合ネットワーク

arXiv cs.CV / 2026/4/9

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、微細な空間的詳細と大域的な意味文脈の両方を捉えることで、リモートセンシングの意味セグメンテーションを改善することを目的としたハイブリッド量子-古典マルチスケール融合ネットワーク「HQF-Net」を提案する。
  • HQF-Netは、マルチスケールの意味的ガイダンスのために凍結したDINOv3 ViT-L/16バックボーンを活用し、これをDeformable Multiscale Cross-Attention Fusion(DMCAF)モジュールを介してカスタマイズしたU-Netに統合する。
  • さらに特徴を精緻化するため、フレームワークは、量子強化スキップ接続(QSkip)と、補完的な量子回路コンポーネント間で適応的ルーティングを行うMixture-of-Experts(QMoE)構成による量子ボトルネックを追加する。
  • 3つのリモートセンシングベンチマークでの実験により、一貫した性能向上が報告されており、LandCover.aiでは0.8568 mIoU / 96.87% accuracy、OpenEarthMapでは71.82% mIoU、SeasoNetでは55.28% mIoU / 99.37% accuracyを達成している。
  • アブレーションスタディにより、改善は主要なアーキテクチャ要素(DMCAF、QSkip、量子ボトルネック/QMoE設計)によるものであることが示され、近い将来の量子計算における制約下でも提案するハイブリッド処理アプローチが支持される。

要旨: リモートセンシングの意味セグメンテーションでは、複雑なシーンにまたがって、細かな空間的ディテールと高レベルの意味文脈を同時に捉えられるモデルが必要です。U-Netのような従来のエンコーダ・デコーダ型アーキテクチャは強力なベースラインであり続けていますが、グローバルな意味情報や、構造化された特徴の相互作用を十分に活用することが難しい場合が多いです。本研究では、リモートセンシング画像セグメンテーションのためのハイブリッド量子-古典マルチスケール融合ネットワークであるHQF-Netを提案します。HQF-Netは、凍結したDINOv3 ViT-L/16バックボーンから得られるマルチスケールな意味ガイダンスを、Deformable Multiscale Cross-Attention Fusion(DMCAF)モジュールを通じてカスタマイズしたU-Netアーキテクチャに統合します。特徴の洗練を強化するため、さらに量子強化スキップ接続(QSkip)と、Mixture-of-Experts(QMoE)を備えた量子ボトルネックを導入します。ここでは、補完的な局所・大域・方向性のある量子回路を、適応的ルーティング機構の中で組み合わせます。3つのリモートセンシングベンチマークでの実験では、提案設計による一貫した改善が示されました。HQF-Netは、LandCover.aiで0.8568 mIoUおよび96.87%の全体精度、OpenEarthMapで71.82% mIoU、SeasoNetで99.37%の全体精度とともに55.28% mIoUを達成しています。アーキテクチャのアブレーション研究により、主要な各コンポーネントの寄与もさらに確認されています。これらの結果は、近い将来の量子制約のもとでリモートセンシングの意味セグメンテーションを改善する有望な方向性として、構造化されたハイブリッド量子-古典の特徴処理が考えられることを示しています。