効率的なグローバル分光スーパー・トークンクラスタリングによるハイパースペクトル画像分類

arXiv cs.CV / 2026/5/1

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 本論文は、ハイパースペクトル画像分類におけるスーパーピクセル手法の重要な弱点として、クラスタリングが空間的な領域を作る一方で分類器が多くの場合ピクセル単位で予測してしまい、領域レベルの一貫性や境界整合が弱まる点を指摘しています。
  • DSCC(Dual-stage Spectrum-Constrained Clustering-based Classifier)として、クラスタリングと分類を明示的に切り離し、スペクトル類似性と空間近接性の制約で境界を保持する「スペクトル・スーパートークン」を生成した上でトークン単位の予測を行うデュアルステージのエンドツーエンド枠組みを提案しています。
  • DSCCは、画像レベルの多基準特徴距離、局所性を考慮した割り当ての正則化、密度分離に基づく中心選択を用いて、代表的でよく分離されたクラスタ中心を作りつつ冗長性を抑え、スケール変動への頑健性を高めています。
  • トークン内に混在する土地被覆(混合クラス)に対応するため、クラス割合を符号化するソフトラベル方式を導入し、混合クラスのスーパートークンに対する頑健性を向上させています。
  • WHU-OHSデータセットでCF1=0.728、197.75 FPSを達成し、既存手法より精度と効率のバランスが優れていること、さらに汎用性が実験で裏付けられています。

要旨: ハイパースペクトル画像の分類では、空間的に一貫した予測と、正確な境界の描定が求められる。しかし、従来のスーパーピクセルベースの手法には本質的な矛盾がある。すなわち、クラスタリングは類似した画素を領域へとまとめる一方で、その後の分類器は画素単位で処理を行うため、領域の一貫性が損なわれる。その結果、既存手法では、領域レベルで、かつ境界に整合した分類が保証されない。 この制約に対処するために、我々はデュアルステージ・スペクトラム拘束クラスタリングベース分類器(DSCC)を提案する。DSCCは、クラスタリングと分類を明示的に切り離すことによって、クラスタリングから分類への影響を端から端まで(end-to-end)で制御する枠組みである。具体的には、まずスペクトル的に類似し、かつ空間的に近接した画素をスペクトル・スーパートークンへとグルーピングし、その後にトークンレベルの予測を行う。 DSCCの中核では、画素と中心間の画像レベルのマルチクライテリア距離を計算し、続いて局所性を考慮した割当ての正則化を行うことで、境界を保持するスペクトル・スーパートークンの生成を可能にする。さらに、密度分離に基づく中心選択により、代表的でよく分離された中心が得られ、冗長性が削減され、スケール変動に対する頑健性が向上する。各トークン内の混合された土地被覆の構成に対応するために、クラス割合を符号化するソフトラベル方式を導入し、混合クラスのトークンに対する頑健性を高める。 DSCCは、WHU-OHSデータセットにおいて197.75 FPSでCF1が0.728に達し、最先端手法と比較して優れた精度と効率のトレードオフを提供する。大規模な実験により、提案するデュアルステージのパラダイムが、ハイパースペクトル画像分類に対して有効であり、かつ汎用性があることがさらに検証される。ソースコードは https://github.com/laprf/DSCC で公開されている。