選好フィードバック付きベイズ最適化におけるトンプソンサンプリングの有限時間解析
arXiv cs.LG / 2026/4/29
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- この論文は、スカラー値ではなく「選好のペア比較」としてフィードバックが得られる場合に対応する、ベイズ最適化のためのトンプソンサンプリング手法を提案します。
- ペア比較は、潜在効用差に対する単調リンクを用いてモデル化し、基底カーネルから導出されるデュエル(dueling)カーネルを活用します。
- 著者らは有限時間の性能保証を示し、提案手法がスカラー・フィードバックのベイズ最適化における標準的なトンプソンサンプリングと同等の性能を達成し得ることを明らかにします。
- 解析では、チェレンジャー選択におけるアンカー不変性などの性質を利用し、double-TS のペアリング変種も提案し、合成データと実データの両方で有効性を実証しています。


