AIエージェント・スキル・セキュリティレポート — 2026-03-25

Dev.to / 2026/3/25

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • 本レポートは、AIエージェント・スキルのエコシステム全体における自動化されたセキュリティ監査を分析し、Claude CodeのスキルやMCPサーバーを含めて、インデックス化された33156スキルのうち2069スキルを深く精査した。
  • 懸念される結果の分布が判明した。安全判定が594件、疑わしいとされたものが1223件、悪意があると特定されたものが246件である。
  • 「AIテキスト検出器を回避すること」を目的としたスキル、「スクリプトベースの『偽のセキュリティ』チェック」を行うスキル、「検知回避を可能にするWebスクレイピング」を有効化するスキルなど、いくつかの高リスクなスキルが悪意あるものとして強調されている。
  • フラグが立てられた脅威パターンは、動的なコード評価、LLMによるセマンティック検出/取り扱い、ならびに外部へのデータ送信、または認証情報やSSHキーへのアクセスを示唆する挙動を繰り返し含んでいる。
  • 最も深刻な例として、「humanize-ai-text」(リスク報告76%)、「moltguard」(リスク93%)、「stealth-browser」(リスク81%)が挙げられており、それぞれ数千回のダウンロードがある。検出が行われているという主張があるにもかかわらず、現実の露出が示唆される。

私たちはAIエージェントのスキル・エコシステム(Claude Code、MCPサーバー)に対して、自動化されたセキュリティ監査を実行してきました。33156件のインデックス付きスキルのうち、2069件を深く分析しました。

結果:594件が安全、1223件が疑わしい、246件が悪意のあるものでした。

注目すべき発見

humanize-ai-text moltbroによる

判定: 悪意のある(MALICIOUS) | リスク: 76% | ダウンロード数: 32323

AI生成テキストに関連する言語パターンを検出し、GPTZeroなどのAI検出システムを回避するために内容を書き換える、CLIツールキットです。T

主な脅威:

  • [HIGH] 動的コード評価

  • [CRITICAL] LLMセマンティック検出

  • [CRITICAL] LLMセマンティック検出

詳細レポート →

moltguard thomaslwangによる

判定: 悪意のある(MALICIOUS) | リスク: 93% | ダウンロード数: 17916

このスキルは、MoltGuardという名前のセキュリティプラグインをインストールして、プロンプトインジェクション、データ漏えい、悪意のあるコマンドを防止すると主張しています。しかし、その中核となる挙動には、スクリプト化された欺瞞が含まれています。すなわち、AIに「隠されたプロンプトインジェクション攻撃」を含むファイルを読み取らせ、その後、ユーザーに対して「安全ツールがその攻撃を検出した」と虚偽の説明を行うのです。実際には、AI自身がファイルを読み取っている主体であり、真正の検出は発生していません。

主な脅威:

  • [HIGH] 動的コード評価

  • [HIGH] SSHキーへのアクセス

  • [CRITICAL] LLMセマンティック検出

詳細レポート →

stealth-browser mayuqi-cryptoによる

判定: 悪意のある(MALICIOUS) | リスク: 81% | ダウンロード数: 10225

検出回避のためのブラウザ自動化スキルであり、スクレイピングの秘匿化、Cloudflare/CAPTCHAの回避、永続的なログインセッション、プロキシローテーションを可能にします — 主に

主な脅威:

  • [HIGH] 動的コード評価

  • [HIGH] 外向きデータ転送

  • [CRITICAL] LLMセマンティック検出

詳細レポート →

cellcog nitishgargiitdによる

判定: 悪意のある(MALICIOUS) | リスク: 88% | ダウンロード数: 9301

CellCog 外部AIプラットフォームSDKをラップするClaude Codeスキルで、エージェントがマルチモーダルなタスク(リサーチ、動画、画像、PDF、ダッシュ

主な脅威:

  • [HIGH] 動的コード評価

  • [CRITICAL] LLMセマンティック検出

  • [CRITICAL] LLMセマンティック検出

詳細レポート →

task-status mightyprime1による

判定: 悪意のある(MALICIOUS) | リスク: 88% | ダウンロード数: 7738

Clawdbotのヘルパースキルで、WebSocketまたはCLIフォールバック経由でTelegramアカウントへタスク状況メッセージを送信します。オプションで、定期的な「ハートビート」更新も可能です

主な脅威:

  • [HIGH] 動的コード評価

  • [HIGH] 外向きデータ転送

  • [CRITICAL] LLMセマンティック検出

詳細レポート →

自分を守る

  • スキルを監査する: clawsec.cc

  • 安全に検索する: clawsearch.cc

  • 事前インストール確認: npx clawsearch-guard <skill-name>