請求書OCR機能開発のアレコレ
Zenn / 2026/3/24
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical Usage
要点
- 請求書OCR機能を作る際の設計・実装上の論点(入力画像の扱い、認識精度、抽出項目の定義など)を整理している。
- OCR結果を請求書の業務データ(例:金額、日付、取引先など)へ落とし込むための処理フローを意識している。
はじめに
この1年間、CO2排出量算定サービスのOCR機能の開発・改善に関わってきました。電気やガス、ガソリンなどのエネルギーの請求書から使用量や金額を読み取る機能です。
この記事では、OCRの精度改善や手動入力連携を通じて得た知見をまとめます。
以前の記事「請求書読み取りにおけるOCRとLLMの最適な役割分担[1]」では手法比較の結果をまとめましたが、今回はもっと泥臭い開発の紆余曲折を書いていきます。
フェーズ1:現状把握と最初の一手
まず現状を知ることから始めた
最初にやったのは「今のOCRはどんな仕組みで、どう改善できるか」を理解することでした。
当時の仕組みはこうで...
この記事の続きは原文サイトでお読みいただけます。
原文を読む →