Difyのテキスト抽出ノードで日付取得がうまくいかなかった時に試したことと解決策

Zenn / 2026/4/13

💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage

要点

  • Difyの「テキスト抽出ノード」で日付を取得しようとした際、期待通りに日付が取れないケースが起きたことを前提に、試行内容と解決策をまとめている。
  • 日付取得がうまくいかない原因として、抽出結果のフォーマットや扱う文字列の状態(そのままパースできない形など)にズレがある可能性を検討し、切り分けを行っている。
  • 解決策として、抽出したテキストの整形(必要に応じた前処理)や、日付として解釈される形式に寄せる調整を行うことで成功率を上げている。
  • 同様の詰まりが起きたときのために、どこを確認してどう調整するかの手順として実用的に整理されている。
📝 はじめに 採用候補者の履歴書・職務経歴書をDifyのワークフローで解析し、資格の取得年月や学歴の卒業年月などをJSON形式で構造化出力するシステムを運用しています。 「資格の取得年月や卒業年月が実際の書類と違う値になっている」というバグ報告があり、調査を行いました。 プロンプトの改善で対処しようとしましたが、最終的にはテキスト抽出ノードによるPDF構造の崩壊が根本原因であることが判明し、ワークフローのアーキテクチャ変更で解決しました。 本記事では、原因の特定プロセスと最終的な解決策について記録します。 ⚙️ 環境 Dify(ワークフロー) Gemini 3 Flash(L...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →