マルチソースドメイン適応のための一般的な表現ベースアプローチ

arXiv cs.LG / 2026/4/28

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、教師ありの複数ソースから教師なしターゲットへ何を転送すべきかという観点で、教師なしマルチソース・ドメイン適応を扱います。
  • 従来の深層表現に基づく手法は、同定(identifiability)を保証するために独立潜在変数やラベル分布不変などの制約的な仮定に依存しがちだと指摘しています。
  • 提案手法は、予測タスクに関連したコンパクトな潜在表現を学習し、ラベルのマルコフブランケット(全ての予測情報)をそのまま使うと一般設定では過不足が生じ得ることを示します。
  • さらに同定可能性を確立するために、マルコフブランケットの表現を「親・子・配偶者」に分割するという着想が鍵になると説明しています。
  • これらの理論に基づき、さまざまな分布シフトに対応できる実用的な非パラメトリックなドメイン適応手法を提案します。

Abstract

教師なしドメイン適応における中心的な問題は、ラベル付きソースドメインからラベルなしターゲットドメインへ何を転送するべきかを決定することです。高次元の観測(例:画像)を扱うために、一連のアプローチでは深層学習を用いて観測の潜在表現を学習し、その潜在空間における知識転送を容易にしています。しかし、既存のアプローチの多くは、ターゲットドメインにおける結合分布の識別可能性を確立するために、独立な潜在変数や不変なラベル分布などの、制約の強い仮定に依存しがちであり、現実世界での適用可能性を制限しています。本研究では、予測タスクに対する分布シフトを捉えるコンパクトな潜在表現を学習する、一般的なドメイン適応の枠組みを提案し、どの表現を学習し転送すべきかという根本的な問いに取り組みます。とりわけ、まず、学習された表現に関してラベルのマルコフブランケット(すなわち、ラベルに関する全ての予測情報に基づく表現の学習)は、一般設定ではしばしば過小指定(underspecified)になり得ることを示します。代わりに、興味深いことに、マルコフブランケットの表現を、ラベルの親・子・配偶(spouses)の表現へと分割することで、一般的なドメイン適応が達成できることを示します。さらに、その識別可能性の保証も確立できます。これらの理論的洞察に基づいて、分布シフトのさまざまなタイプを扱える、一般設定におけるドメイン適応のための実用的でノンパラメトリックなアプローチを開発します。