要旨: 本論文は、ノイズ分布が無限分散をもつ場合における、比例漸近レジーム(p/n -> gamma > 0)での高次元M推定の研究を行う。指数alphaが(1,2)に属する、規則的に変動する裾(tail)をもつノイズに対して、正則化されたM推定量の漸近的振る舞いが、損失関数のフェンチェル共役の定義域に関する単一の幾何学的性質によって支配されることを示す。すなわち、その定義域が有界であることが支配的である。
その共役定義域が有界である場合――これは、Huber、絶対値、およびクアンタイル損失関数の場合に該当する――は、推定量のミニマックス定式化における双対変数が拘束され、実効的なノイズはノイズ分布の有限な1次絶対モーメントへと減少し、外部情報に頼ることなく推定量は有界リスクを達成する。有界でない場合――これは二乗損失の場合のように――では、双対変数はノイズに比例してスケールし、実効的なノイズは発散する2次モーメントを含むことになる。このとき、有界リスクを達成するには、外部事前分布へ向けた移送正則化(transfer regularization)によってのみ可能となる。
二乗損失クラスに特化して、ノイズに適応した正則化スケーリングのもとで、凸ガウス・ミニマックス定理(Convex Gaussian Minimax Theorem)により厳密な漸近リスクを導出する。得られたリスクは、正則化器に依存しない普遍的な床(floor)へ収束し、その結果として損失—リスクの三分法(trichotomy)が生じる。すなわち、移送なしの二乗損失推定量は発散する。Huber損失推定量は有界だが消えない(非消失)リスクを達成する。移送正則化された推定量は床を達成する。
共役領域の二分法:高次元における無限分散ノイズ下でのM推定量の厳密なリスク
arXiv stat.ML / 2026/3/31
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、裾が正則に変動する(tail index α ∈ (1,2))無限分散ノイズのもとで、比例漸近レジーム(p/n → γ > 0)における高次元M推定を解析する。
- 正則化されたM推定量の漸近的なリスク挙動は、損失関数のフェンシェル共役の定義域が有界か無界かという幾何学的性質によって決まることを示す。
- フェンシェル共役の定義域が有界な損失(例:Huber、絶対値、分位点)では、双対変数は実質的に制約され、ノイズの影響は有限な一次の絶対モーメントにまで低減し、外部/転移情報なしでも推定量は有界なリスクを達成する。
- 二乗損失のように共役定義域が無界な損失では、双対変数はノイズに応じて増大し、リスクは発散する二次モーメントに依存し、有界なリスクを得るには外部事前に向けた転移正則化が必要となる。
- 二乗損失の場合、著者らはノイズに適応した正則化を用い、Convex Gaussian Minimax Theorem により厳密な漸近リスクを導出し、三分法(trichotomy)を得る:非転移の二乗損失リスクは発散し、Huber型の有界性は消えないリスクにつながり、転移正則化手法は普遍的なリスク下限に到達する。



