我正在创建一个服务来监视扫描文件的文件夹。一旦文件存在,该服务就会将其拾取,并将其转换为可读的 PDF。在此过程中,该服务还会搜索条形码。在此之后,提取文本并将文件及其文本存储到我们软件的数据库中。位置基于条形码。
现在,对于 OCR,我们使用的是 Atalasoft ( http://www.atalasoft.com/ ) 的 SDK。此 SDK 中还包含条码识别器。
但是转换后的文本仍然存在一些错误。(我用其他 OCR 程序进行了一些测试,但 Atalasoft 的结果很好。)我正在寻找一些软件(SDK-kit),它可以让我提高用于 OCR 目的的 PDF 的质量。
我测试了 Kofax VRS Elite ( http://www.kofax.com/vrs-virtualrescan/ )。我正在寻找类似的东西,但可以使用某种 SDK 套件在服务中实现。
任何人以前这样做过,或有类似的问题?提前谢谢!