収益最大化における学習曲線について

arXiv cs.LG / 2026/4/30

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、単一商品・単一買い手の設定で収益最大化に特化した学習曲線を調べ、学習データ数が増えるにつれて誤差がどの程度減衰するかを明らかにする。
評価額（バリュエーション）の分布に制約がない場合でも、Bayes整合的（学習曲線が任意の分布でサンプル数 n→∞ によりゼロ誤差へ収束する）な収益最大化アルゴリズムが存在することを示すが、最適収益が有限でも収束は任意に遅くなり得る。
逆に、最適収益が有限の価格で達成される場合には、学習曲線の誤差減衰率は概ね 1/√n となることを提示する。
評価額が離散的な値の集合にしか支持されない分布では、学習曲線がほぼ指数関数的に減衰し得ることを示し、PAC型の分布フリー枠組みでは達成できない速さの率を実現する。
まとめると、本研究は従来の分布フリー（最悪ケース包絡）に基づく学習曲線の捉え方を見直し、学習ダイナミクスの実際の形（分布の形状依存性）を捉えることを目指している。

日経XTECH

Dev.to

Dev.to

Dev.to

Dev.to