痕跡を論理へ:長期のエージェント型タスクに向けた神経記号的学習によるプログラム的スキル誘導

arXiv cs.AI / 2026/5/5

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、基盤モデル駆動エージェントにおける重要な制約として、プロンプトベースの推論だけに依存する場合の長期計画の脆さを扱います。
  • 相互作用のトレースを、状態に依存しないパラメータ化スクリプトではなく、明示的な論理に根ざしたモジュール型プログラムへ変換する Neuro-Symbolic Skill Induction(NSI)を提案します。
  • NSIは制御フローと動的な変数バインディングを合成し、エージェントが「何をするか」だけでなく「いつ・なぜ行うか」を状況に応じて学べるようにします。
  • 少数例から効率的に汎化し、未見の目標へ柔軟に適応できることを狙いとしています。
  • 複数のエージェント型タスクで実験を行い、既存の最先端ベースラインに対して一貫して優れた結果が報告されています。

概要: 基盤モデル駆動のエージェントは、純粋にプロンプトに基づく推論の一過性の性質により、長期の計画にしばしば困難を抱えます。既存のスキル誘導手法は、経験を状態に無関係なパラメータ化スクリプトへ蒸留することでこれを緩和しますが、動的な環境で堅牢に実行するために必要な条件分岐の論理を捉えきれていません。本論文では、相互作用の記録(トレース)をモジュール化された、\textit{論理に基づく}プログラムへと持ち上げる枠組みである、ニューラル・シンボリック・スキル誘導(NSI)を提案します。明示的な制御フローと動的な変数束縛を合成することで、NSIはエージェントが\textit{いつ}そして\textit{なぜ}行動すべきかを発見できるようにします。このパラダイムは効率的な汎化を可能にし、エージェントが少数ショットの例からスキルを誘導し、未知の目標に対して柔軟に適応できるようにします。一連のエージェント型タスクに対する実験により、NSIは一貫して最先端のベースラインを上回り、エージェントが自ら進化して、\textit{論理に基づく}スキルの設計者へと成長できることを示します。