要旨: エージェントは、自律的な「考える-行動する-観測する」ループによって、タスク固有のプロンプト作成を不要にすることを目指している。とはいえ、実際には、誘導としてタスク固有の計画に従うよう指示されることが一般的である。例えば、ソフトウェア問題を解決する際に、ナビゲーション、再現、パッチ、検証といった段階に沿う計画に従うよう求められる。しかし残念ながら、エージェントが実際にそのように指示された計画にどの程度従っているのかは、どこまで明らかになっていない。このような分析がないと、所与の計画にどの程度エージェントが準拠しているかを判定できず、解決に至ったのが正しい戦略的推論によるのか、それとも別の手段、例えばデータ汚染やベンチマークへの過学習によるのかを評価できない。本論文は、プログラミングエージェントにおける計画準拠(plan compliance)について、16,991の軌跡を用いた最初の大規模かつ体系的な分析を提示する。具体的には、SWE-agentを、SWE-bench Verified および SWE-bench Pro の4つのLLMに対して、8種類の計画バリエーションのもとで評価する。明示的な計画がない場合、エージェントは学習中に身につけた内部のワークフローに依存するが、それらはしばしば不完全であり、過学習している、あるいは一貫して適用されていない。標準的な計画を与えることで問題解決は改善され、さらに、計画を定期的にリマインドすることで計画違反を抑え、タスク成功を向上できることを観察する。質の低い計画は、計画がまったくない場合よりも、さらにパフォーマンスを悪化させる。驚くべきことに、計画に追加のタスク関連フェーズを初期段階で盛り込むことは、パフォーマンスを低下させ得る。特に、それらのフェーズがモデルの内部の問題解決戦略と整合していない場合に顕著である。これらの知見は、研究上のギャップを浮き彫りにする。すなわち、モデルに指示された計画に従わせることを教える微調整パラダイムであり、タスク固有の計画をモデル内部にエンコードするのではない枠組みである。これは、ワークフローを記憶するのではなく、モデルに適応的に推論し行動することを教える必要がある。
計画から実行へ:エージェントはどれくらい計画に従うのか?
arXiv cs.CL / 2026/4/15
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- エージェント(例:SWE-agent)は、タスク固有の計画に従うよう指示されることが多いが、本論文では、どの程度確実に遵守しているのか、またそれが正しい推論によって本当に解決に到達しているかにどう影響するのかは不明確だったと論じている。
- SWE-bench Verified および SWE-bench Pro のテストで、4つのLLMに対して16,991本のトラジェクトリを用いた大規模な評価により、8種類の計画バリエーションを検討し、その結果、計画を省略すると、内部で学習したワークフローに立ち戻ることで不完全・過学習・一貫しない適用が生じうることが分かった。
- 標準的な計画を提示すると課題解決は改善する一方、定期的な計画リマインドは計画違反を減らし、タスク成功率を高めることができる。
- 重要な結果として、たとえ計画が良くない場合でも「計画を提示しない」よりもパフォーマンスを悪化させうること、また、モデル内部の問題解決戦略と衝突する場合は、追加の初期フェーズが結果を劣化させうることが示された。
- 本結果は、研究上のギャップを示唆する。すなわち、符号化されたタスク計画に依存するのではなく、将来的なファインチューニングでは、記憶された/不整合なワークフロー挙動を防ぐために、適応的な「推論と行動」プランの追従を教えるべきだということである。




