Promptfooの撤退後のトップ5 AIエージェント評価ツール
Dev.to / 2026/3/16
📰 ニュースSignals & Early TrendsTools & Practical UsageIndustry & Market Moves
要点
- OpenAIは3月9日にPromptfooを8,600万ドルで買収し、Promptfooがベンダー中立を維持するかどうかについて疑問を投げかけている。
- 本記事はPromptfooの独立系代替としてDeepEval、Braintrust、Arize Phoenix、LangSmith、Comet Opikの5つを取り上げており、いずれもモデル提供企業に所有されていない。
- DeepEvalはDAG(有向非巡回グラフ)やツール呼び出しなどのエージェント指標を備えた、pytestネイティブのオープンソース評価フレームワークで、プロダクション監視は提供せず、ローカルのセルフホストオプションを提供する。
- BraintrustはCI/CDゲート、8つのRAGによるカスタム評価、トレースとスコアリングによるプロダクション監視、そしてエンタープライズ専用のセルフホストを提供するホスト型プラットフォームである。
- Arize PhoenixはOSSとクラウドを組み合わせ、OTELトレースと無料のセルフホストオプションを提供する。LangSmithはクラウドとセルフホストの併用を提供し、LangChainネイティブ対応(企業向けセルフホスト階層)をサポートする。Comet OpikはOSSとクラウドの組み合わせで、大容量のトレースとApache 2.0ライセンスを特徴とする。
この記事の続きは原文サイトでお読みいただけます。
原文を読む →



