ノイズを含むデータに対する推論のための畳み込み型最大平均差異(convMMD)

arXiv stat.ML / 2026/4/15

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、計測誤差によって汚染されたデータ(既知の分布から生成される可能性のある、非一様な分散ノイズを含む)に対する新しい推論フレームワークを提案する。
  • 畳み込み型最大平均差異(convMMD)を導入し、ノイズで畳み込んだ後に分布を比較することで、標準的なカーネル仮定のもとで計量の妥当性を保つ。
  • 著者らは、計測誤差に影響されない有限標本の偏差境界を導出し、ノイズ下での仮説検定とカーネル平滑化の同値性を示す。
  • convMMDに基づく推定量を提示し、その一貫性と漸近正規性を証明する。また、確率的勾配降下法による効率的な実装も示す。
  • 実験および実世界の応用(とりわけ天文学と社会科学)により、観測がノイズを含む状況下での実用的な有効性が実証される。

概要: 現代のデータ解析では、変数の標本が計測誤差によって汚染されている状況にしばしば遭遇します。計測雑音を無視すると統計的推論の精度が大きく損なわれ得る一方で、既存の補正手法はしばしば計算コストが高く非効率です。近年のカーネル法、特に最大平均不一致(Maximum Mean Discrepancy; MMD)に基づく手法の進展により、柔軟で分布に依存しない推論が可能になりましたが、通常は精確なデータを前提としており、計測誤差による汚染を見落としがちです。本研究では、既知の分布に由来する、場合により分散が異なる(ヘテロスケダスな)雑音によって汚染された標本に対する推論のための新しい枠組みを導入します。本アプローチの中核は畳み込みMMD(convolutional MMD; convMMD)であり、雑音の畳み込みの後に分布を比較し、標準的なカーネル条件の下で計量としての妥当性を保持します。測定誤差の影響を受けない有限標本の偏差(deviation)境界を確立し、雑音下での検定とカーネル平滑化の同値性を証明します。これらの洞察を活用し、雑音を含むヘテロスケダスな観測に対する推論のためのconvMMDベースの推定量を提案します。その整合性と漸近正規性を示し、確率的勾配降下法による効率的な実装も提示します。シミュレーションおよび天文学・社会科学への応用を通じて、本手法の実用的な有効性を示します。