android - 使用 Tesseract OCR 和 tess-two 时的垃圾结果

翻译自：https://stackoverflow.com/questions/39243586 2016-08-31T07:43:11.820

982 次

0

我使用 Tesseract OCR 库开发了 OCR 应用程序，并从以下链接中引用。

但有时我会收到垃圾数据作为结果。任何人都可以帮助我进一步做什么以获得准确的结果。

1 回答 1

2

如果您想获得针对您的案例的具体帮助以及您正在使用的任何代码，您应该提供您的测试图像，但获得准确结果的一般经验法则是：

使用高分辨率图像（如果需要）最低 300 DPI
确保图像中没有阴影或弯曲
如果有任何歪斜，您需要在 ocr 之前在代码中修复图像
使用字典来帮助获得好的结果
调整文字大小（12 pt 字体是理想的）
将图像二值化并使用图像处理算法去除噪声

最重要的是，有很多图像处理功能可以根据您的图像帮助提高准确性，例如歪斜、透视校正、线条去除、边框去除、点去除、去斑等等，具体取决于您的图像.

于 2016-09-03T19:22:38.837 回答