TurboEvolve:高速かつ堅牢なLLM駆動プログラム進化に向けて

arXiv cs.AI / 2026/4/22

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LLM駆動のプログラム進化を固定の評価予算の下でよりサンプル効率よく、かつ堅牢にすることを目的としたマルチアイランド進化フレームワーク「TurboEvolve」を提案する。
  • 「verbalized Sampling」により、LLMにK個の多様な候補と、明示的な自己付与のサンプリング重みを生成させ、さらにオンライン・スケジューラで停滞状況に応じてKを動的に調整する。
  • 既存の解の蓄積を活用するために、「seed-pool injection」を導入し、シードをクラスタリングして島ごとに配分し、制御された摂動とエリート保存で探索と洗練のバランスを取る。
  • 複数のプログラム最適化ベンチマークで、TurboEvolveは低い予算でもより高い性能を達成し、いくつかのタスクで既知の最良解を改善することが示される。

概要: LLM駆動のプログラム進化は高品質なプログラムを発見できますが、そのコストと実行ごとの分散が、信頼性の高い進展を妨げています。そこで本研究では、固定された評価予算のもとで、サンプル効率と頑健性を向上させるマルチアイランド進化フレームワークTurboEvolveを提案します。進化アルゴリズムにおける複数子孫戦略に着想を得て、TurboEvolveは言語化されたサンプリングを導入し、LLMに対してK個の多様な候補を、明示的に自己割り当てしたサンプリング重みとともに生成するよう促します。さらに、停滞時には探索を拡大するためにKを適応的に増減し、安定して進展している局面ではオーバーヘッドを抑えるオンラインスケジューラを導入します。既存の解のプールを活用するために、さらに「シードプール注入」も提案します。これは、シードをクラスタリングし、制御された摂動とエリート保持を伴って、それらを複数のアイランドに割り当てることで、多様性と洗練のバランスを取ります。複数のプログラム最適化ベンチマークにおいて、TurboEvolveは一貫して、より低い予算でより強力な性能を達成し、いくつかのタスクで最良既知解を改善します。