我在我的 iOS 应用程序中使用 Tesseract OCR 3.01,当我从手机库中选择图像时,它显示了 90% 的数据准确率。但是如果我使用相机中的相同图像,它会显示混乱的字母。我按照本教程进行操作,请指导我是否可以做些什么来确保它在相机上工作,因为它适用于画廊图像。
问问题
2561 次
2 回答
3
是的,有三件事要具体说明,首先,OCR 适用于黑白图像而不是彩色图像,因此,如果您可以尝试将图像转换为黑白,它将提高准确性。
第二件事是大小和方向,你需要强制图像为640*480或320大小,这样既可以提高识别速度,也可以提高准确率,对于方向,有很多方法可以管理.
最后,如果您可以允许用户指定他想要执行 OCR 的确切位置或图像的哪个部分,这将大大提高准确性和时间,因为库不需要检查整个图像的文本,而是您已经指定了要搜索的部分。
PS:过去几周我一直致力于创建一个 OCR 应用程序。
于 2013-01-09T02:27:22.140 回答
2
几乎可以肯定,问题是“方向”。苹果倾向于以一种位图的形式创建图像——图像位的布局就好像相机在它的一侧,音量按钮在顶部和右侧。您看到的看起来更高而不是更宽的图像仍按上述方式布置,但图像中包含的 EXIF 对象中有一个“方向”。
我猜测 tesseract 不会查看 EXIF,但希望图像采用“标准”格式,以便文本处于阅读文本的位置。
您可以使用右上角的音量按钮拍摄的相机图像来测试我的假设。
如果它们有效,那么您需要自己处理图像,并根据方向设置重新排列位。这并不难做到,但需要您阅读 vImage 和/或位图上下文。
于 2012-08-14T11:30:56.040 回答