要旨: 本稿では、関数最適化を、予算制約下における逐次的な意思決定問題として考察する。この制約により、最適化中に許される目的関数評価の回数が制限される。そこで我々は、連続版の多腕バンディット問題から着想を得たアルゴリズムを考える。このアルゴリズムは、探索(領域の初期の準一様探索)と活用(潜在的に大域的な極大値の周りでの局所最適化)との間のトレードオフを解くことで、この最適化問題に取り組む。我々は、領域分割によって動作する決定論的アルゴリズムである、いわゆる Simultaneous Optimistic Optimization(SOO)を導入する。このような手法の利点は、返される解に関する保証と、アルゴリズムの数値的効率である。我々は、最適化のためのこの機械学習アプローチを提示し、単一目的の実パラメータ数値最適化テストスイートに関する CEC'2014 競技において SOO を実証的に評価した結果を示す。
バンディットによる関数最適化の強化
arXiv cs.LG / 2026/5/6
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文では、関数最適化を評価回数(予算)に制約のある逐次意思決定問題として定式化し、目的関数の呼び出し回数を制限する前提を扱います。
- 探索と活用のバランスを取りながら大域的な最大値の可能性を狙う、Simultaneous Optimistic Optimization(SOO)という決定論的アルゴリズムを提案しています。
- SOOは、連続版のマルチアームドバンディットの考え方に触発されており、探索には準一様な初期探索、活用には局所最適化を用いる設計です。
- ドメイン分割に基づくアプローチにより、返される解に対する保証と、アルゴリズムの数値効率が得られると主張しています。
- CEC'2014の単一目的・実数パラメータ最適化テストスイートに対して実験評価を行い、SOOの性能を示しています。



