自動プロンプト最適化のための汎化可能な自己進化メモリ
arXiv cs.CL / 2026/3/24
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、単一の固定プロンプトを特定のタスクに当てはめることではなく、異なるクエリにわたって一般化できるプロセスとして自動プロンプト最適化を捉え直す提案を行う。
- MemAPO はデュアルメモリ(2つのメモリ)システムを用いる。成功した推論トラジェクトリから抽出した再利用可能な戦略テンプレートを保存し、さらに再発する失敗のパターンを捉える構造化された誤り(エラー)情報を保存する。
- 新しいプロンプトに対しては、関連する戦略と既知の失敗パターンの両方を取得し、過去の誤りを避けつつ効果的な推論を促すように改良されたプロンプトを合成する。
- 自己反省とメモリ編集を反復することで、MemAPO はメモリを継続的に更新し、タスクごとに最初からやり直すことなく最適化性能を時間とともに向上させられるようにする。
- 複数のベンチマークでの実験により、従来のプロンプト最適化手法に対して一貫した改善が得られ、かつ最適化コストが低いことが報告されている。

