Promptfooの撤退後のトップ5 AIエージェント評価ツール

Dev.to / 2026/3/16

📰 ニュースSignals & Early TrendsTools & Practical UsageIndustry & Market Moves

要点

  • OpenAIは3月9日にPromptfooを8,600万ドルで買収し、Promptfooがベンダー中立を維持するかどうかについて疑問を投げかけている。
  • 本記事はPromptfooの独立系代替としてDeepEval、Braintrust、Arize Phoenix、LangSmith、Comet Opikの5つを取り上げており、いずれもモデル提供企業に所有されていない。
  • DeepEvalはDAG(有向非巡回グラフ)やツール呼び出しなどのエージェント指標を備えた、pytestネイティブのオープンソース評価フレームワークで、プロダクション監視は提供せず、ローカルのセルフホストオプションを提供する。
  • BraintrustはCI/CDゲート、8つのRAGによるカスタム評価、トレースとスコアリングによるプロダクション監視、そしてエンタープライズ専用のセルフホストを提供するホスト型プラットフォームである。
  • Arize PhoenixはOSSとクラウドを組み合わせ、OTELトレースと無料のセルフホストオプションを提供する。LangSmithはクラウドとセルフホストの併用を提供し、LangChainネイティブ対応(企業向けセルフホスト階層)をサポートする。Comet OpikはOSSとクラウドの組み合わせで、大容量のトレースとApache 2.0ライセンスを特徴とする。

この記事の続きは原文サイトでお読みいただけます。

原文を読む →