iphone - iPhone 上的 Tesseract 训练

Question

我在我的一个应用程序中使用 Tesseract，但我无法获得完美的结果。当我在完美的屏幕截图上使用该库时，它会获取大部分文本，这很好。但是，例如，当我在照片上使用它时，它很难解决，有时它甚至不会返回任何东西。

我知道你可以训练 Tesseract，有没有好的训练教程或 iPhone 照片识别的东西？或者在处理之前我应该对源图像进行任何修改吗？

谢谢！

score 2 · Accepted Answer

发布示例图片。以下是一些需要注意的事项：

您如何将图像设置为 1 位？最终 OCR 是在黑白图像中完成的——也许你可以比图书馆做得更好。

图片的DPI是多少？扫描通常在 200-300 DPI 左右，但照片可以是 72 或 96。OCR 引擎会查看 DPI 以了解字母的大小。您可能需要更改 DPI 并重新采样（调整大小）图像，以使 DPI 符合预期。OCR 引擎需要扫描的文档，而不是照片。

1 回答 1