Difyで使えるデータソースプラグインについて調べてみた(Firecrawl・Jina Reader・Watercrawl・Tavily)
Zenn / 4/3/2026
💬 OpinionDeveloper Stack & InfrastructureTools & Practical Usage
Key Points
- Difyで利用できる代表的なデータソースプラグインとして、Firecrawl・Jina Reader・Watercrawl・Tavilyを整理しています。
- 各プラグインの用途(Webクロール/取得、テキスト抽出、検索・情報収集など)を想定ベースで比較し、データ取得パイプラインにどう組み込むかを示しています。
- Dify上でLLMアプリに外部データを取り込む観点から、どのプラグインがどの目的に向くかを検討できる内容になっています。
- プラグイン選定のための調査メモとして、実装前の確認事項(できること/できないこと)を把握する助けになります。
データソースプラグインとは
Difyにはナレッジパイプラインという機能がある。複数のソースからデータを取得し、前処理してからナレッジベースに格納する仕組みで、通常のナレッジベース作成よりも柔軟にデータの加工ができる。
このナレッジパイプラインの入口の1つが「データソース型プラグイン」で、Dify Marketplaceを覗くとFirecrawl、Jina Reader、Watercrawl、Tavilyなど複数のプラグインが並んでいる。それぞれ何が違って、どれを使えばいいのか。
今回は4つのデータソースプラグインを実際にナレッジパイプライン上で動かして比較した。
今回検証に使用した...
Continue reading this article on the original site.
Read original →Related Articles

Black Hat USA
AI Business

Black Hat Asia
AI Business

Claude Code’s Source Leaks, OpenAI Exits Video Generation, Gemini Adds Music Generation, LLMs Learn at Inference
The Batch

MCP Observability: Logging, Auditing, and Debugging Agent-Server Interactions in Production
Dev.to

Why OpenClaw Agents Lose Their Minds Mid-Session (And What It Takes to Fix It)
Dev.to