ios - 正方体 OCR 相机

Question

我在我的 iOS 应用程序中使用 Tesseract OCR 3.01，当我从手机库中选择图像时，它显示了 90% 的数据准确率。但是如果我使用相机中的相同图像，它会显示混乱的字母。我按照本教程进行操作，请指导我是否可以做些什么来确保它在相机上工作，因为它适用于画廊图像。

score 3 · Accepted Answer

是的，有三件事要具体说明，首先，OCR 适用于黑白图像而不是彩色图像，因此，如果您可以尝试将图像转换为黑白，它将提高准确性。

第二件事是大小和方向，你需要强制图像为640*480或320大小，这样既可以提高识别速度，也可以提高准确率，对于方向，有很多方法可以管理.

最后，如果您可以允许用户指定他想要执行 OCR 的确切位置或图像的哪个部分，这将大大提高准确性和时间，因为库不需要检查整个图像的文本，而是您已经指定了要搜索的部分。

PS：过去几周我一直致力于创建一个 OCR 应用程序。

score 2 · Accepted Answer

几乎可以肯定，问题是“方向”。苹果倾向于以一种位图的形式创建图像——图像位的布局就好像相机在它的一侧，音量按钮在顶部和右侧。您看到的看起来更高而不是更宽的图像仍按上述方式布置，但图像中包含的 EXIF 对象中有一个“方向”。

我猜测 tesseract 不会查看 EXIF，但希望图像采用“标准”格式，以便文本处于阅读文本的位置。

您可以使用右上角的音量按钮拍摄的相机图像来测试我的假设。

如果它们有效，那么您需要自己处理图像，并根据方向设置重新排列位。这并不难做到，但需要您阅读 vImage 和/或位图上下文。

2 回答 2