バンディットによる関数最適化の強化

arXiv cs.LG / 2026/5/6

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文では、関数最適化を評価回数（予算）に制約のある逐次意思決定問題として定式化し、目的関数の呼び出し回数を制限する前提を扱います。
探索と活用のバランスを取りながら大域的な最大値の可能性を狙う、Simultaneous Optimistic Optimization（SOO）という決定論的アルゴリズムを提案しています。
SOOは、連続版のマルチアームドバンディットの考え方に触発されており、探索には準一様な初期探索、活用には局所最適化を用いる設計です。
ドメイン分割に基づくアプローチにより、返される解に対する保証と、アルゴリズムの数値効率が得られると主張しています。
CEC'2014の単一目的・実数パラメータ最適化テストスイートに対して実験評価を行い、SOOの性能を示しています。

要旨: 本稿では、関数最適化を、予算制約下における逐次的な意思決定問題として考察する。この制約により、最適化中に許される目的関数評価の回数が制限される。そこで我々は、連続版の多腕バンディット問題から着想を得たアルゴリズムを考える。このアルゴリズムは、探索（領域の初期の準一様探索）と活用（潜在的に大域的な極大値の周りでの局所最適化）との間のトレードオフを解くことで、この最適化問題に取り組む。我々は、領域分割によって動作する決定論的アルゴリズムである、いわゆる Simultaneous Optimistic Optimization（SOO）を導入する。このような手法の利点は、返される解に関する保証と、アルゴリズムの数値的効率である。我々は、最適化のためのこの機械学習アプローチを提示し、単一目的の実パラメータ数値最適化テストスイートに関する CEC'2014 競技において SOO を実証的に評価した結果を示す。

DXは継続、AI活用の新需要を ITサービス（SIer）の業界地図

日経XTECH

2026年版：学生のための無料AIツールトップ10—究極の学習ガイド

Dev.to

AIを“保険の相棒”に：結婚式当日の「もしも」を自動化する

Dev.to

Google、Gemma 4向け「Multi-Token Prediction（MTP）Drafters」をリリース——品質を落とさず最大3倍高速推論

MarkTechPost

Claudeが法廷でハルシネーションを起こすとどうなるか：Latham＆Watkinsの事案と弁護士の責任の意味

MarkTechPost

バンディットによる関数最適化の強化

要点

関連記事

DXは継続、AI活用の新需要を ITサービス（SIer）の業界地図

2026年版：学生のための無料AIツールトップ10—究極の学習ガイド

AIを“保険の相棒”に：結婚式当日の「もしも」を自動化する

Google、Gemma 4向け「Multi-Token Prediction（MTP）Drafters」をリリース——品質を落とさず最大3倍高速推論

Claudeが法廷でハルシネーションを起こすとどうなるか：Latham＆Watkinsの事案と弁護士の責任の意味

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer