広告

平均測度量子化による確率測度からのスケーラブルな学習

arXiv stat.ML / 2026/3/24

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、各データ項が確率測度として表現され、それらを最適輸送(OT)によって比較・操作する統計的学習設定を研究する。
  • OT は大きな支持を持つ測度に対してコストが高くなるという課題に対処するため、平均測度量子化(mean-measure quantization)方式を提案し、各入力測度を共通の支持上の K 点離散測度で近似する。
  • 量子化された表現の整合性(consistency)を証明し、量子化された測度から計算される複数の OT ベースの下流タスクに対する収束保証を与える。
  • 合成データセットと実データセットの両方での実験により、量子化アプローチが、測度ごとの量子化と同程度の性能を達成しつつ、実行時間効率を大幅に改善できることを示す。

要旨: 本論文では、データが確率測度の集合として観測される統計的学習問題を考察する。最適輸送(OT)は、そうした対象を比較し操作するための一般的な手法であるが、測度の台(サポート)が大きい場合、その計算コストが許容できなくなる。そこで我々は、入力測度のすべてを、共通の台を共有する K 点の離散測度で近似する量子化に基づくアプローチを研究する。このとき得られる量子化測度の整合性(consistency)を示す。さらに、量子化測度から計算されるいくつかのOTに基づく下流タスクについて、収束の保証を導出する。合成データおよび実データに対する数値実験により、提案手法は、個別の量子化と同等の性能を達成しつつ、実行時間を大幅に削減できることを示す。

広告
平均測度量子化による確率測度からのスケーラブルな学習 | AI Navigate