Skills-Coach:学習不要のGRPOによる自己進化型スキル最適化フレームワーク
arXiv cs.CL / 2026/5/1
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- Skills-Coachは、LLMベースのエージェントが自己進化によって能力を拡張する方法を高めることを目的とした新しい自動化フレームワークであり、既存のスキル体系の断片化という課題に取り組みます。
- このフレームワークは「多様なタスク生成」「軽量な最適化(スキルのプロンプトと対応コード)」「比較実行と評価」「追跡可能な評価(指定基準に基づく厳密な評価)」の4モジュールで構成され、スキルを体系的にテストして改善します。
- 「training-free GRPO」により追加学習なしでスキルを最適化し、仮想モードと実モードの両方で実行・検証できる柔軟性を備えています。
- 検証には、48種類の多様なスキルをカバーするベンチマークデータセット「Skill-X」を導入し、実験の結果として幅広いカテゴリでスキル能力が有意に向上したことを示しています。
- 総じてSkills-Coachは、知的アプリケーションに必要な包括的なスキル網羅を備えた、より頑健で適応性の高いLLMエージェントの開発を後押しする取り組みとして位置づけられています。




