Upskill:エージェントが実行前に参照するスキル・レジストリ。1万件超をインデックス、無料・オープンソース

Reddit r/LocalLLaMA / 2026/5/3

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 記事では、無料のオープンソース「upskill」を紹介しており、エージェントが難しいタスクを始める前にスキル・レジストリを参照して、既に検証された手順書に基づいて実行できるようにします。
  • 1回インストールして設定(「CLAUDE.md」を用いた1行)を追加することで、エージェントは「upskill find <task>」を実行し、ランディングページのフロントエンド設計やClerk認証のような適切なワークフローを取得するとしています。
  • 仕組みとしては、主要ベンダーやコミュニティから10,000件超のスキルをインデックスし、Postgresの全文検索(FTS)とベクトル埋め込みを組み合わせたハイブリッド検索で候補を絞り、コミュニティの評価などで再ランキングします。
  • オプションとして、ローカルに存在する環境変数の“名前”に基づいて認証・連携に関するスキルの優先度を調整でき、値はマシン外へ送られない設計です。
  • 本プロジェクトは、エージェント層での「mixture of experts」に相当すると位置づけ、一般的なプロンプトだけに頼らず、既存の専門的ワークフローへタスクをルーティングすることで信頼性を高めることを目指しています。
Upskill: スキル登録—開始前にエージェントが参照します。10k+ インデックス済み、無料、オープンソース。

Cursor に実際のタスクを与えて、動く様子を…メモリを頼りに眺めます。

  • ランディングページを依頼する → 汎用的な、ブランド感のない Tailwind ヒーロー
  • Clerk 認証を依頼する → JWT 検証をスキップする
  • 「CSV パーサを書きます」→ papaparse の半分を(まずく)作り直す

あなたはちょうど 20 分と 1k トークンを費やして、すでにどこかオンラインに 完璧な答えがある ものに対して、それを反復している様子を見てしまいました。

イライラの原因は Claude が悪いことではありません。
そうではなく、正しい実行手順(プレイブック)はすでに存在していることです。

  • Anthropic には、フロントエンドの設計スキルが 4,000 語分あります(レイアウト、タイポグラフィ、モーション、アクセシビリティ)
  • Clerk にはエンドツーエンドの認証実装があります
  • obra/superpowers にはさらに何百ものものがあります

専門知識はある。けれどルーティングがない。

私が作ったもの:upskill(無料)

upskill = スキルのルーティング層

一度インストールして、エージェント設定に 1 行追加 (CLAUDE.md) するだけで、次のようになります:

重要なタスクの前に毎回 → エージェントが実行
upskill find "<task>"

当てずっぽうではなく、検証済みのプレイブックを取り出してそれに従います。

何が変わる?

同じプロンプト:「ランディングページをデザインして」
→ いまは Anthropic の実際のプレイブックに従う

同じプロンプト:「Clerk 認証を追加して」
→ JWT 検証を含む完全な実装

たとえるなら:

専門家混合(Mixture of experts)だが、エージェント層で
エージェントは即興をやめて、実証済みのワークフローを実行し始めます。

内部の仕組み

  • 10k+ インデックス済みスキル:
    • Anthropic、OpenAI、Stripe、Vercel、Microsoft
    • Garry Tan(gstack)、obra/superpowers
    • 100+ の独立した著者
  • 検索 = ハイブリッド:
    • Postgres の全文検索(フラグや API などの厳密なもの向け)
    • 1024 次元のベクトル埋め込み(意味的なマッチング向け)
    • 星・インストール数・コミュニティのフィードバックで再ランキング

→ 純粋なベクトルだけでは細部を取り逃す
→ 純粋な FTS だけでは意図を取り逃す
→ ハイブリッドのほうがうまくいく

認証を考慮したランキング(任意)

ローカルに環境変数が存在する場合:

  • AWS_ACCESS_KEY_ID → AWS のスキルのほうが高く評価される
  • STRIPE_SECRET_KEY → Stripe 固有のフローのほうが高く評価される

使用されるのは変数名だけです。値は決してあなたのマシンの外に出ません。

安全性

すべてのスキルは、インデックス作成時に LLM の逆問題的レビューを通過します:

  • プロンプトインジェクション
  • 認証情報の抜き取り
  • タイポスクワッティング/見た目が似ているドメイン
  • 隠された悪意ある指示

10k+ スキルのうち:

  • 数百件がブロックされた
  • 実際の攻撃を発見した(例:隠された onerror="alert('XSS')" + 「テストをスキップ」)

少数の誤検知(調整中):

  • 正当なガイド内の rm -rf node_modules
  • Google Drive の削除 API
  • NEXT_PUBLIC の誤用に関する警告

プライバシー

デフォルト = 固定で制限あり(ロックダウン)

  • upskill find → あなたのクエリだけを送信
  • テレメトリ → オプトイン
  • 環境変数に応じたランキング → オプトイン
  • スキルの投稿 → オプトイン

すべてはいつでも切り替え可能です。

コードだけのためじゃない

次のようなワークフローもカバーします:

  • スライド
  • メールの仕分け(トリアージ)
  • Google Workspace
  • Notion のクエリ
  • カレンダーの自動化
  • 科学的な文章作成
  • マルウェア解析
  • アクセシビリティの監査
  • 営業プレイブック

あなたのエージェントが「その場しのぎでやる」ことになりそうなら…
きっと、もっと良いプレイブックがすでにあります。

試してみる

npm install -g /upskill upskill install npx -y skills add Autoloops/upskill/skill 

いくつか質問をして、自分自身をあなたのエージェントに組み込みます。

リポジトリ:https://github.com/Autoloops/upskill
MIT ライセンス。PR は歓迎します。

submitted by /u/Comprehensive_Quit67
[link] [comments]