最近いくつかテストを回していて、正直なところ驚かされました。
新しい HunyuanOCR(特にGGUF版)を試したところ、低予算のハードウェアでの性能がとんでもないです。 1Bパラメータモデル を使っていて、手元の古い GTX 1060 で 約90 t/s 出ています。
精度はほぼ完璧で、軽量に感じるのが信じられないくらいです。
ここでは、スムーズに動かすのに4090が必要ない、信頼できるローカルOCRツールを求める投稿をたくさん見かけます。これは、待っていた「欠けていたリンク」かもしれません。
GGUF:
https://huggingface.co/ggml-org/HunyuanOCR-GGUF/tree/main
ORIGINAL MODEL:
https://huggingface.co/tencent/HunyuanOCR
[リンク] [コメント]




