ガウス分布を超える打ち切り下での平均検定

arXiv stat.ML / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

この論文は、観測が未知の打ち切り集合から得られ、最大で確率質量のε割合が隠され得る状況における、高次元平均検定の理論的限界を調べます。
導出される情報理論的な検出可能性の閾値では、信号強度αが O(ν_{P,p} ε^{1-1/p}) のオーダーでスケールするバイアス項より小さい場合、無限データでも帰無仮説と対立仮説は区別不能になります。
αがこの閾値を超えると、著者らは単純な二次テストが、共分散の大きさと（α − 4ν_{P,p}ε^{1-1/p}）のギャップに応じて、ほぼ最適なサンプル複雑度を達成できることを示します。
さらに、方向付き中央値の正則性という条件のもとでは、打ち切りバイアスが O(ε) まで改善される「構造的な抜け道」を特定し、中間レジームで古典的な検定レートが回復することを明らかにします。
全体として、本研究は打ち切り下の平均検定の挙動を、有界モーメント型、亜ガウス的、中央値正則性といった構造的領域にわたって統一的に整理します。

u_{P,p}\varepsilon^{1-1/p}) $のバイアスが生じます。このバイアスは鋭い情報理論的な検出可能性の下限を作ります。すなわち、信号$ alpha $がこの閾値を下回ると、無限データがあっても帰無仮説と対立仮説は区別不可能になります。この下限の上では、単純な二次（second-order）検定が、ほぼ最適なサンプル計算量<br>$ n = O\!\left(\frac{\|\Sigma_P\|}{(\alpha-4
u_{P,p}\varepsilon^{1-1/p})^2}\sqrt{d}\right) $<br>を達成することを証明します。さらに我々は、この有限モーメントに起因するバイアス障壁からの構造的な抜け道も特定します。方向付き中央値（directional median）の正則性（regularity）に関する仮定のもとでは、打ち切りバイアスは線形次数$ O(\varepsilon) $へと改善します。これにより、中間的なレジームが明らかになります。すなわち、均一な回復（uniform recovery）には$ Theta(d) $個のサンプルが必要である一方、打ち切りバイアスが除去されると検定は古典的な$ Theta(\sqrt d)$ の率を取り戻します。これらの結果は、打ち切り下の平均検定に関する統一的な枠組みを与え、有限モーメント、サブガウス（sub-Gaussian）、および中央値正則という構造的レジームを結び付けます。