10000個のスキャン済みPDF(モバイルからスキャンされたもの)を持っているとして、そういう規模でも十分に速くて正確なOCRが見つかりません。
PaddleOCRのVLパイプラインのようなさまざまなビジョン言語モデルを試したり、こちらで入手した別のものも使ってみました。ですが、ほぼ正確ではあるものの、あまりに遅すぎます。
私のGPUはかなり強力です。RTX 6000 pro blackwell です。
そこで、速さがとにかく桁違いに速く、なおかつ同時に正確でもあるものを何を動かせばいいのでしょうか。
[link] [comments]




