SHIFT：重い裾の汚染下で平均用量反応関数を推定するための頑健なダブル機械学習

arXiv stat.ML / 2026/5/4

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

この論文は、平均用量反応関数を推定する標準的なダブル機械学習（DML）が、カーネル重み付き局所線形平滑化器の「非有界な影響」により外れ値に強く脆弱になり得ると指摘しています。
SHIFT（Self-calibrated Heavy-tail Inlier-Fit with Tempering）は、クロスフィットによるヌイサンスの直交化に加えて、カーネル局所のWelsch損失をGraduated Non-Convexityで最適化し、さらに防御的なOLSリフィットを組み合わせます。
局所的な重い裾の汚染ストレステスト（p=0.25）では、SHIFTはレベル-RMSEを1.03から0.33へ大きく低下させる一方、クリーン時や一様汚染時では挙動をほぼ維持しています。
1,400回のメインスイープ適用では、SHIFTは最悪ケースの形状復元で競争力のある結果（p=0.25でRMSE 0.325）を示し、特に最悪ケースRMSEが0.35未満の手法群の中で、非一様なサンプル重みを出して外れ値マスクを平均F1約0.96（範囲0.945〜0.968）で回復できる点が強調されています。
FrechetとWeibullの尾部レジームを見分けて、SHIFTとL1代替案のどちらを使うかを実データの根拠に基づいて選べるようにするため、Extreme Value Theoryに基づく診断スイートを提案しています。
また、二値処置のCATE（Huber擬似アウトカム×X-Learner）や時系列ADRF（block-CV＋rolling MAD）への拡張、さらに一様汚染下では頑健なDMLにおいて勾配ブーストより線形ヌイサンスモデルが有利になり得るという逆説的なアブレーション結果も含まれています。
本記事は、AIエンジニアリングというより、重い裾の汚染下での因果的用量反応推定のための頑健な統計手法が中心です。