みなさん、こんにちは。
私はOCRタスク向けにビジョン・ランゲージモデルのファインチューニングに取り組んでおり、最新のリリースを共有したいと思います。これは英語の左から右に読む文書OCRに特化して最適化されたQwen3.5-2Bのファインチューニングモデルです。
モデルリンク: loay/English-Document-OCR-Qwen3.5-2B
特にごちゃごちゃした文書や特定のエッジケースで試してみた場合、ぜひフィードバックをいただけると嬉しいです。モデルの性能がどうかぜひ教えてください!




