広告

MAPLE:階層型マルチラベル画像分類のためのレベル認識埋め込みを用いたマルチパス適応伝播

arXiv cs.CV / 2026/4/1

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • MAPLEは、単一の画像が複数の分類学的ブランチを活性化し得る状況を対象とした、リモートセンシングにおける階層型マルチラベル分類のためのフレームワークとして提案される。
  • これは、グラフに配慮したテキスト記述から初期化されたレベル認識埋め込み、GCNによるグラフ構造の符号化、意味上の事前知識と視覚的根拠のバランスを取る適応的マルチモーダル融合メカニズムを組み合わせる。
  • MAPLEは、階層レベルごとに適切な損失を自動的に選択する適応的なレベル認識目的関数を用い、階層的な依存関係の学習を改善する。
  • CORINEに整合した地球観測データセット(AID、DFC-15、MLRSNet)での実験により、約2.6%のパラメータ増加のみで、少数ショット設定において最大+42%の一貫した向上が報告されている。

Abstract

階層的マルチラベル分類(HMLC)は、リモートセンシングにおける構造化されたラベル依存関係をモデリングするために不可欠です。しかし、既存の手法はマルチパス設定においてはうまく機能しません。そこでは、画像が複数の分類系統(タクソノミ分岐)を同時に活性化し得るため、階層情報が十分に活用されないという問題が生じます。私たちは、MAPLE(Multi-Path Adaptive Propagation with Level-Aware Embeddings)という枠組みを提案します。この枠組みは、(i) グラフを意識したテキスト記述からの階層的意味初期化、(ii) グラフ畳み込みネットワーク(GCN)によるグラフベースの構造符号化、(iii) 意味の事前知識と視覚的根拠のバランスを動的に調整する適応的なマルチモーダル融合、を統合します。適応的なレベル認識(level-aware)目的関数が、階層の各レベルに対して適切な損失を自動選択します。CORINE に整合したリモートセンシングデータセット(AID、DFC-15、MLRSNet)での評価では、少数ショット(few-shot)環境において最大 +42% の一貫した改善が示され、追加されるパラメータはわずか 2.6% にとどまります。これにより、MAPLE が地球観測(EO)における階層的意味を効果的かつ効率的にモデル化できることが実証されます。

広告