共形ロバスト集合推定(Conformal Robust Set Estimation)

arXiv stat.ML / 2026/4/21

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、データに外れ値や重い裾を含む場合に標準的な共形予測が頑健性を欠きうるという弱点に取り組む。
  • 各点の「ハーフマス半径(half-mass radius)」に基づく非適合度スコアを用い、これは(⌊n/2⌋+1)近傍までの距離としても同値である。
  • その結果得られる共形集合が任意のサンプルサイズで周辺的に妥当であること、さらに距離-to-メジャー汎関数で定義されるロバストな母集団中心集合へ確率収束することを示す。
  • 緩やかな正則性条件のもとで、経験的な共形領域と母集団対応物の差を定量化する指数的な集中結果およびテール境界が確立される。
  • 以上より、重い裾や多峰性分布に対しても、ロバストな幾何学的スコアを共形予測に用いることの確率的な理論的根拠が与えられる。

Abstract

共変予測(Conformal prediction)は、交換可能性の下で有限標本における分布フリーのカバレッジを提供しますが、標準的な構成は外れ値や重い裾(heavy tails)が存在する場合に頑健性を欠くことがあります。そこで本研究では、点の周りの半質量半径(half-mass radius)として定義される非適合度スコアに基づく、頑健な共変予測手法を提案します。これは同値に、その点からの距離として (\lfloor n/2\rfloor+1) 近傍の最近隣(nearest neighbour)までの距離を用いることに対応します。 得られる共変領域が、任意の標本サイズに対して周辺的に有効(marginally valid)であることを示し、さらに確率収束として、距離から測度への汎関数を通じて定義される頑健な母集団中心集合へ収束することを示します。緩やかな正則性条件の下で、経験的な共変領域とその母集団対応物とのズレを定量化する指数的な集中と裾(tail)に関する境界(tail bounds)を導出します。これらの結果は、重い裾や多峰性分布であっても、共変予測において頑健な幾何学的スコアを用いることを確率論的に正当化するものです。