Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我使用 Tesseract OCR 库开发了 OCR 应用程序,并从以下链接中引用。
但有时我会收到垃圾数据作为结果。任何人都可以帮助我进一步做什么以获得准确的结果。
如果您想获得针对您的案例的具体帮助以及您正在使用的任何代码,您应该提供您的测试图像,但获得准确结果的一般经验法则是:
使用高分辨率图像(如果需要) 最低 300 DPI
确保图像中没有阴影或弯曲
如果有任何歪斜,您需要在 ocr 之前在代码中修复图像
使用字典来帮助获得好的结果
调整文字大小(12 pt 字体是理想的)
将图像二值化并使用图像处理算法去除噪声
最重要的是,有很多图像处理功能可以根据您的图像帮助提高准确性,例如歪斜、透视校正、线条去除、边框去除、点去除、去斑等等,具体取决于您的图像.