収益最大化における学習曲線について

arXiv cs.LG / 2026/4/30

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、単一商品・単一買い手の設定で収益最大化に特化した学習曲線を調べ、学習データ数が増えるにつれて誤差がどの程度減衰するかを明らかにする。
  • 評価額(バリュエーション)の分布に制約がない場合でも、Bayes整合的(学習曲線が任意の分布でサンプル数 n→∞ によりゼロ誤差へ収束する)な収益最大化アルゴリズムが存在することを示すが、最適収益が有限でも収束は任意に遅くなり得る。
  • 逆に、最適収益が有限の価格で達成される場合には、学習曲線の誤差減衰率は概ね 1/√n となることを提示する。
  • 評価額が離散的な値の集合にしか支持されない分布では、学習曲線がほぼ指数関数的に減衰し得ることを示し、PAC型の分布フリー枠組みでは達成できない速さの率を実現する。
  • まとめると、本研究は従来の分布フリー(最悪ケース包絡)に基づく学習曲線の捉え方を見直し、学習ダイナミクスの実際の形(分布の形状依存性)を捉えることを目指している。