4月27日、私たちはiFixAiという無料の診断ツールをオープンソース化します。これをあなたのAIシステム(エージェント、コパイロット、LLM連携など、何を使っていても)に対して実行すると、5つのカテゴリにわたる33のベンチマークでテストされ、その後、幻覚、プロンプトインジェクション、出力の一貫性の欠如などのミスアライメント問題にどこでさらされているかを示すレポートが提示されます。
完全に無料で、条件はありません。私たちは、この問題が私たちよりもはるかに大きいと考えて作りました。
[リンク] [コメント]




