Difyで使えるデータソースプラグインについて調べてみた(Firecrawl・Jina Reader・Watercrawl・Tavily)

Zenn / 2026/4/3

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage

要点

  • Difyで利用できる代表的なデータソースプラグインとして、Firecrawl・Jina Reader・Watercrawl・Tavilyを整理しています。
  • 各プラグインの用途(Webクロール/取得、テキスト抽出、検索・情報収集など)を想定ベースで比較し、データ取得パイプラインにどう組み込むかを示しています。
  • Dify上でLLMアプリに外部データを取り込む観点から、どのプラグインがどの目的に向くかを検討できる内容になっています。
  • プラグイン選定のための調査メモとして、実装前の確認事項(できること/できないこと)を把握する助けになります。
データソースプラグインとは Difyにはナレッジパイプラインという機能がある。複数のソースからデータを取得し、前処理してからナレッジベースに格納する仕組みで、通常のナレッジベース作成よりも柔軟にデータの加工ができる。 このナレッジパイプラインの入口の1つが「データソース型プラグイン」で、Dify Marketplaceを覗くとFirecrawl、Jina Reader、Watercrawl、Tavilyなど複数のプラグインが並んでいる。それぞれ何が違って、どれを使えばいいのか。 今回は4つのデータソースプラグインを実際にナレッジパイプライン上で動かして比較した。 今回検証に使用した...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →