ReVEL:構造化されたパフォーマンスフィードバックによる、マルチターン反省型LLM誘導ヒューリスティック進化

arXiv cs.AI / 2026/4/8

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、NP困難な組合せ最適化問題に対するヒューリスティックを進化させるために、進化アルゴリズム内部でLLMをインタラクティブなマルチターン推論器として用いるハイブリッド・フレームワークReVELを提案する。
  • ReVELは、従来のワンショットLLMによるコード生成に比べて、2つの中核メカニズムを追加することで改善する:パフォーマンス・プロファイルによるグルーピング(ヒューリスティックを振る舞いが首尾一貫したグループにクラスタリングし、コンパクトなフィードバックを可能にする)と、構造化されたマルチターン反省(グループ単位の振る舞い分析に基づいて、狙いを定めた改良案を提案する)。
  • 提案されたヒューリスティック改良は選択的に適用され、EAベースのメタコントローラによって、探索と活用のバランスを適応的に調整しつつ検証される。
  • 標準的な組合せ最適化ベンチマークでの実験により、ReVELはより頑健で多様なヒューリスティックを生成し、強力なベースラインに対して統計的に有意な改善が示される。
  • 著者らは、最適化設定における自動ヒューリスティック設計のための、原理に基づくパラダイムとして「マルチターン推論」と「構造化されたグルーピング」を位置づけている。