要約: カーネル化された一般化線形モデル(GLMs)における共変量シフトの下での監督なしドメイン適応のための、原理的な枠組みを提案します。これは、リッジ正則化を用いたカーネル化された線形回帰、ロジスティック回帰、ポアソン回帰を含みます。私たちの目標は、共変量分布の違いにもかかわらず、ラベル付きのソースデータとラベルなしのターゲットデータを活用して、ターゲットドメインでの予測誤差を最小化することです。ラベル付きソースデータを2つのバッチに分割します。1つは候補モデルのファミリを訓練するため、もう1つは補完モデルを構築するためです。この補完モデルはターゲットデータに対して疑似ラベルを生成し、堅牢なモデル選択を可能にします。未知の共変量シフトを明示的に考慮した「有効なラベル付きサンプルサイズ」を通じて、適応性能を特徴づける非漸近的過剰リスク境界を確立します。合成データセットと実データセットの実験は、ソースのみのベースラインに対して一貫した性能向上を示しています。
カーネルGLMによる教師なしドメイン適応の疑似ラベル付け
arXiv stat.ML / 2026/3/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 共変量シフト下の教師なしドメイン適応のための原理的フレームワークを提案し、リッジ正則化を用いたカーネル化線形回帰、カーネル化ロジスティック回帰、ポアソン回帰を含むカーネルGLMを対象とする。
- ラベル付きソースデータを2つのバッチに分割し、1つは候補モデル群の訓練、もう1つはターゲットデータの疑似ラベルを生成する補完モデルを構築するために用い、堅牢なモデル選択を可能にする。
- 未知の共変量シフトを考慮した「有効ラベル付きサンプルサイズ」を特徴とする非漸近的過剰リスク境界を確立し、理論的保証を提供する。
- 合成データと実データセットで、ソースのみのベースラインよりも性能が向上することを実証し、提案手法を検証する。