オープンソースのエージェント系リポジトリの大規模マイニングによるスキル獲得の自動化: マルチエージェント手続き知識抽出のフレームワーク

arXiv cs.AI / 2026/3/13

📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文は、オープンソースリポジトリ(例: GitHub)をマイニングして高品質なエージェントスキルを自動的に獲得し、LLMベースのエージェントに手続き的能力を付与するフレームワークを提案する。
  • 最先端のエージェント系システムである TheoremExplainAgent および Code2Video が Manim アニメーションエンジンを活用していることを踏まえ、視覚化能力と教育的能力の抽出に焦点を当てている。
  • このフレームワークは、リポジトリの構造分析、密な検索によるセマンティックなスキル識別、そしてスキルを標準化された SKILL.md 形式へ翻訳することを含み、モデルの再学習を行わずにスケーラブルな知識抽出を可能にする。
  • セキュリティガバナンスと多次元評価も含まれ、エージェント生成の教育コンテンツは人間のチュートリアルと同等の品質を維持しつつ、知識移転の効率を約40%向上させることができると報告している。
本文: arXiv:2603.11808v1 アナウンス種別: new 要旨: モノリシックな大規模言語モデル(LLMs)から、モジュラー化されスキルを備えたエージェントへと移行することは、人工知能の展開における根本的なアーキテクチャのシフトを意味します。汎用モデルは宣言知識の広さにおいて顕著な広がりを示す一方で、自律的なワークフローにおける有用性は、専門的な手続き知識の不足によりしばしば制約されます。本報告は、GitHub などのプラットフォーム上のオープンソースリポジトリをマイニングすることによって高品質なエージェントスキルを自動的に獲得する体系的フレームワークを調査します。私たちは、Manim 数学アニメーションエンジンを活用する TheoremExplainAgent および Code2Video を含む最先端システムから、視覚化能力と教育的能力の抽出に焦点を当てます。このフレームワークは、リポジトリの構造分析、高密度検索を用いたセマンティックなスキル識別、および標準化された SKILL.md 形式への翻訳を含みます。我々は、エージェント性リポジトリからの体系的抽出と厳密なセキュリティガバナンスおよび多次元評価指標を組み合わせることで、モデルの再学習を必要とせずに手続き知識をスケーラブルに獲得できることを示します。我々の分析は、エージェント生成の教育コンテンツが、40%の知識移転効率の向上を達成しつつ、人間が作成したチュートリアルと同等の教育的品質を維持できることを示しています。