AI Navigate

AIエージェントの悪用データベースを作成しました。無料で公開され、オープンです。

Dev.to / 2026/3/22

📰 ニュースDeveloper Stack & InfrastructureTools & Practical Usage

要点

  • KYA Abuse Database は、APIキーやレート制限を必要とせずにAIエージェントの履歴を確認できる、2つのエンドポイントを持つ無料のオープンリソースです。
  • チェックエンドポイントは、エージェント名、状態、報告数、重大度、理由などのフィールドと、安全な利用を導くための推奨を返します。
  • 疑わしいエージェントを POST エンドポイントで報告でき、問題のあるエージェントに関するクラウドソースデータ(証拠付き)を蓄積します。
  • このプロジェクトは MCP サーバーワークフローを想定して設計されており、npm install mcp-trust-guard のような簡易統合パスを含みます。

MCP サーバーは月間 9700万件の SDK ダウンロードを記録しています。生産環境で稼働しているのは 1 万件超です。これらのいずれも、ツールを呼び出すエージェントが悪意の挙動として報告されているかどうかを確認していません。

あるエージェントが1つのシステムからデータを外部へ持ち出すところを検知されます。次に接続するシステムは?全く見当がつきません。AI エージェントの世界には悪者のデータベースが共有されていません。すべてのシステムはゼロから始まります。

だから、私は1つ作りました。

KYA 悪用データベース

エンドポイントは 2 つ。無料。API キー不要。チェックのレート制限なし。

エージェントをチェック:

curl https://agentscores.xyz/api/abuse/check?agent=some-agent

返却結果:

{
  "agent": "some-agent",
  "status": "reported",
  "report_count": 2,
  "severity": "high",
  "reasons": ["prompt_injection", "data_exfiltration"],
  "recommendation": "CAUTION"
}

悪質エージェントを報告:

curl -X POST https://agentscores.xyz/api/abuse/report \
  -H "Content-Type: application/json" \
  -d '{
    "agent_identifier": "bad-agent",
    "reason": "data_exfiltration",
    "evidence": "Agent read /etc/passwd via MCP tool"
  }'

あなたの MCP サーバーでの利用

npm install mcp-trust-guard
import { McpGuard } from 'mcp-trust-guard';

const guard = new McpGuard({
  abuseCheck: true,
  abuseBlockLevel: 'CAUTION',
});

app.use('/mcp', guard.middleware());

Every tools/call リクエストは、ツールが実行される前に悪用データベースと照合されます。

独立して使用する場合

npm install kya-abuse-check
import { checkAbuse } from 'kya-abuse-check';

const result = await checkAbuse('some-agent');
if (result.recommendation === 'BLOCK') {
  // interactしない
}

依存関係ゼロ。1つの関数。フェイルオープン。

ネットワーク効果

これは人々が使って初めて機能します。報告が増えるたび、データベースは誰にとってもより価値のあるものになります。今はデータベースは空です。現状がこのままであるとは限りません。

KYA(Know Your Agent)の一部

悪用データベースは、KYA(Know Your Agent)の6つの検証チェックの1つです:

  • デプロイヤー — このエージェントを作成した人
  • モデル — どの LLM がそれを動かしているか
  • コード — ソースは監査可能か
  • 悪用 — これが報告されているか
  • 権限 — どのアクセスが必要か
  • デプロイ — どう実行されているか

詳しくは agentscores.xyz

npm パッケージ: