40個のアウト・オブ・ディストリビューションのプロンプト、間接的な依頼、ロールプレイの枠組み、仮想シナリオ、技術的な言い回しでベンチマークしました。ほかのすべてをすり抜けてしまう類のものです。
Arc Gate: P=1.00, R=1.00, F1=1.00
OpenAI Moderation API: P=1.00, R=0.75, F1=0.86
LlamaGuard 3 8B: P=1.00, R=0.55, F1=0.71
誤検知ゼロ。見逃しゼロ。ブロックされたプロンプトの平均は329msで、決してあなたのモデルに到達しません。検出オーバーヘッドは、通常の上流レイテンシに加えて約350msです。
任意のOpenAI互換エンドポイントの前段に配置します。こちら側にGPUは不要です。環境変数を1つ設定するだけです。
GitHub: https://github.com/9hannahnine-jpg/arc-gate
ライブダッシュボード: https://web-production-6e47f.up.railway.app/dashboard
質問には喜んでお答えします。
[link] [comments]




