クラッシュ・フィードバック付き優先ベイズ最適化

arXiv cs.RO / 2026/4/3

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、ブラックボックスのパラメータ学習において、ユーザの嗜好判断とクラッシュ報告の両方を取り込めるようにする、優先ベイズ最適化の拡張手法「CrashPBO」を提案する。
ロボティクスのハードウェア最適化における重要な実務上の失敗モード、すなわちクラッシュした試行がコストのかかるリセット、ハードウェアの摩耗、そして無駄な実験につながる問題に焦点を当てる。標準的なPBOでは、この影響を適切に考慮できない。
合成ベンチマークの結果、CrashPBOはクラッシュ頻度を63%低減しつつ、データ効率も向上する。
3つのロボティクス・プラットフォームでの実環境評価により、本手法が幅広く適用可能で、他環境へも移植できることが示される。これにより、人間が介入する制御パラメータ調整のための柔軟な枠組みとしての利用が支持される。