Trust-SSL：ロバストな航空画像自己教師あり学習のための加法的残差付き選択的不変性

arXiv cs.CV / 2026/4/24

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

共有:

要点

本論文は、霧・モーションブラー・雨・遮蔽などにより意味情報が大きく損なわれる場合でも堅牢性を保つことを目的とした航空画像の自己教師あり学習手法「Trust-SSL」を提案します。
Trust-SSLは、アラインメント目的に対してサンプルごと・因子ごとの信頼重みを導入し、信頼重みにはstop-gradientを適用しつつ加法的残差としてコントラスト損失に組み込むことで、バックボーンへの悪影響を避けます。
210,000枚の画像コーパスで200エポックのプロトコルを用いた実験では、複数のバックボーンに対してEuroSAT、AID、NWPU-RESISC45で最良の平均線形プローブ精度が得られ、SimCLRやVICRegを上回りました。
情報が消失する強い破壊的腐敗（corruption）で特に大きな改善が見られ、天候ストレステストを用いたゼロショットのドメイン横断評価でもMahalanobis AUROCで+1〜+3点の一貫した向上が示されています。
Dempster-Shafer融合に基づくエビデンス（evidential）版では「不一致（conflict）」や「無知（ignorance）」などの解釈可能な信号が得られ、信頼（不確実性）を考慮したSSLの設計指針として位置付けられます。コードは公開されています。

Abstract

自己教師あり学習（SSL）は、航空画像における表現学習の標準的な手法です。既存の手法は、データ拡張によって意味内容が保持される場合にうまく機能する、「拡張されたビュー同士の不変性」を強制します。しかし、航空画像はしばしば、もや、モーションブラー、雨、遮蔽によって劣化し、重要な証拠が失われます。クリーンなビューと大きく劣化したビューとの間の整合を強制すると、潜在空間に紛らわしい（spurious）構造が導入され得ます。本研究では、このような破損に対するSSLの頑健性を高めるためのトレーニング戦略とアーキテクチャ修正を提案します。具体的には、アラインメント目的に対して、サンプルごと・因子ごとの信頼重みを導入し、ベースのコントラスト損失を加法的な残差（additive residual）として組み合わせます。乗算ゲートの代わりに、信頼重みにストップグラディエント（stop-gradient）を適用します。乗算ゲートは自然な選択ですが、実験の結果、乗算ゲートはバックボーンを損なう一方で、加法的残差アプローチはそれを改善することが示されます。210,000枚の画像コーパスに対して200エポックのプロトコルを用いると、この手法は、EuroSAT、AID、NWPU-RESISC45において6つのバックボーンのうち平均線形プローブ精度が最も高くなります（SimCLRの88.46%と比較して90.20%、VICRegの89.82%と比較しても上回る）。また、EuroSATでの厳しい情報消失型の破損において最大の改善が得られます（SimCLRと比べてもやでs=5において+19.9ポイント）。さらに、この手法は、BDD100Kの天候分割を用いたゼロショットのクロスドメイン・ストレステストにおいて、Mahalanobis AUROCで+1〜+3ポイントの一貫した向上も示します。2つのアブレーション（スカラー不確実性とコサインゲート）は、これらの改善の主因が加法的残差の定式化であることを示します。Dempster-Shaferの融合を用いたエビデンシャルなバリアントでは、対立（conflict）と無知（ignorance）を表す解釈可能なシグナルが導入されます。これらの知見は、不確実性を考慮したSSLのための具体的な設計原則を提供します。コードは https://github.com/WadiiBoulila/trust-ssl で公開されています。