Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我在我的一个应用程序中使用 Tesseract,但我无法获得完美的结果。当我在完美的屏幕截图上使用该库时,它会获取大部分文本,这很好。但是,例如,当我在照片上使用它时,它很难解决,有时它甚至不会返回任何东西。
我知道你可以训练 Tesseract,有没有好的训练教程或 iPhone 照片识别的东西?或者在处理之前我应该对源图像进行任何修改吗?
谢谢!
发布示例图片。以下是一些需要注意的事项:
您如何将图像设置为 1 位?最终 OCR 是在黑白图像中完成的——也许你可以比图书馆做得更好。
图片的DPI是多少?扫描通常在 200-300 DPI 左右,但照片可以是 72 或 96。OCR 引擎会查看 DPI 以了解字母的大小。您可能需要更改 DPI 并重新采样(调整大小)图像,以使 DPI 符合预期。OCR 引擎需要扫描的文档,而不是照片。