こんにちは。学校の課題で取り組んでいて、現在フォームのOCRツールをテストしています。
対象の書類は主に、ラベル付きの項目やセクションがある申請/登録フォームのような、構造化または半構造化されたフォームです。私のアイデアは、まず管理者が書類のテンプレートをアップロードし、その後ユーザーが記入済みフォームをアップロードすると、システムがそこからデータを抽出する、というものです。抽出後はユーザーが結果を確認し、項目が正しいかチェックし、誤って読み取られた内容があれば編集します。
そのため、テンプレートに基づく抽出にうまく対応できるOCR/ドキュメント理解ツールを探しています。ただし、後からドキュメントのレイアウトが変わった場合にも、ある程度の柔軟性があるものが望ましいです。
いまはGoogle Document AIを試していて、次はPaddleOCRをテストする予定です。このような用途におすすめのOCRツールがあれば教えてほしいと思いました。
主に、次のようなものを探しています:
- スキャンしたフォームでうまく動く
- 抽出したテキストを正しい項目に対応付けられる
- テンプレート/レイアウトが変わっても運用しやすい
- 学生の調査研究プロジェクトとして現実的である
Document AI, PaddleOCR, Tesseract, AWS Textract, Azure AI Document Intelligence、またはフォーム用途で類似のものを使ったことがあるなら、ぜひあなたの考えを聞かせてください。
[リンク] [コメント]




