クラッシュ・フィードバック付き優先ベイズ最適化
arXiv cs.RO / 2026/4/3
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、ブラックボックスのパラメータ学習において、ユーザの嗜好判断とクラッシュ報告の両方を取り込めるようにする、優先ベイズ最適化の拡張手法「CrashPBO」を提案する。
- ロボティクスのハードウェア最適化における重要な実務上の失敗モード、すなわちクラッシュした試行がコストのかかるリセット、ハードウェアの摩耗、そして無駄な実験につながる問題に焦点を当てる。標準的なPBOでは、この影響を適切に考慮できない。
- 合成ベンチマークの結果、CrashPBOはクラッシュ頻度を63%低減しつつ、データ効率も向上する。
- 3つのロボティクス・プラットフォームでの実環境評価により、本手法が幅広く適用可能で、他環境へも移植できることが示される。これにより、人間が介入する制御パラメータ調整のための柔軟な枠組みとしての利用が支持される。




