要旨: 経験から学ぶことは、能力のある大規模言語モデル(LLM)エージェントを構築するうえで極めて重要です。しかし、現在主流の自己進化パラダイムは依然として非効率です。エージェントは孤立した状態で学習し、限られた経験から同様の行動を何度も再発見してしまうため、冗長な探索が生じ、汎化性能も低下します。この問題に対処するために、我々は、エージェントや環境をまたいで再利用可能な、
\textbf{プラグアンドプレイなスキル知識ベース}を構築するための完全自動化フレームワークであるSkillXを提案します。SkillXは、3つの相乗的な革新に基づく、完全自動化パイプラインによって動作します:
\textit{(i) 多層スキル設計}は、生の軌跡を、戦略プランの3階層構造、機能スキル、原子的スキルへと蒸留します;
\textit{(ii) 繰り返しスキル洗練}は、実行フィードバックに基づいてスキルを自動的に改訂し、ライブラリの品質を継続的に向上させます;
\textit{(iii) 探索的スキル拡張}は、シードとなる学習データを超えてカバレッジを広げるために、新たなスキルを積極的に生成・検証します。強力なバックボーン・エージェント(GLM-4.6)を用いて、再利用可能なスキルライブラリを自動的に構築し、AppWorld、BFCL-v3、そして \tau^2-Bench を含む、長いホライズンかつユーザーとのインタラクションを伴う挑戦的ベンチマーク上で、その転移可能性を評価します。実験の結果、SkillKBは、より弱いベース・エージェントに組み込んだ場合でも一貫してタスク成功率と実行効率を改善し、汎化可能なエージェント学習には、構造化された階層的な経験表現が重要であることを示しています。コードはまもなく https://github.com/zjunlp/SkillX で公開します。
SkillX:エージェント向けスキル知識ベースを自動構築する
arXiv cs.CL / 2026/4/7
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- SkillXは、LLMエージェントの学習効率と汎化性能を向上させるために、再利用可能でプラグアンドプレイなスキル知識ベースを完全自動で構築するフレームワークとして提示される。
- このアプローチでは、生のトラジェクトリから3段階の階層型スキル設計(戦略的プラン、機能スキル、原子的スキル)を抽出し、冗長な探索を回避する。
- SkillXは、実行フィードバックを用いてスキルライブラリを反復的に改良し、学習したスキルの品質を継続的に向上させる。
- また、初期のシード学習データを超えて、新たな探索スキルを生成し検証することで、スキルを拡張し、カバー範囲を広げる。
- GLM-4.6バックボーンを用いた実験では、構築されたSkillKBがタスク成功と実行効率を改善し、とりわけより弱いベースエージェントへの転移時に有効であることが示され、コードは近日公開予定である。




