9

我需要从 iPhone 上的相机图像中实时识别数字。我知道图像上的数字不会超过 5 位。

考虑到 iPhone 的计算规格,这个问题是否真的可以解决?有没有人有使用 Tesseract OCR 库的经验,你认为可以通过使用它来解决吗?

4

5 回答 5

11

这取决于您对“实时”的定义,但是是的,应该可以相对快速地识别 iPhone 4 上的数字 0-9,特别是如果您可以使用字体、照明条件等它们会出现在。

我强烈推荐阅读有关Sudoku Grab 如何使用 iPhone 相机识别谜题的文章。在他们的案例中,使用经过训练的神经网络来识别数字,这在现代 iOS 硬件上应该相当简单和快速。

当前的识别库,如 OpenCV,将使用 iPhone 的 CPU 进行处理。我听说他们可以完成更复杂的任务,例如面部识别,速度足以与视频源一起使用,同时显示出最少的口吃。

为了获得更好的性能,我相信新款 iOS 设备上的可编程 GPU 具有很大的潜力。在我的基准测试中,当使用 iPhone 4 的 GPU 进行简单的图像处理时,我看到了 14X - 28X 的加速。虽然现在很少有人关注这个,但像 Sudoku Grab 的神经网络这样的东西应该是一个足够并行的过程,可以从在 GPU 上运行中受益。

于 2011-02-03T16:30:31.357 回答
1

它应该在计算上是可能的。有可以实时获取条形码的应用程序,也有可以进行实时翻译的应用程序。(字镜头)。但是,我不确定他们使用什么库。

于 2011-02-03T14:27:08.770 回答
1

是的,可以使用 tesseract 引擎

如果您想检查,这是示例代码...

https://github.com/nolanbrown/Tesseract-iPhone-Demo

于 2011-09-13T04:12:58.680 回答
1

有免费的 SDK:http ://rtrsdk.com/支持 iOS 和 Andorid,实时工作,帮助您捕获任何文本,数字应该不是问题。

免责声明:我为 ABBYY 工作

于 2017-06-06T10:06:12.713 回答
0

是的。本德尔可以帮助你。它可以让你在 iOS 上构建和运行神经网络。由于它在引擎盖下使用金属,因此运行快速且平稳。它还支持直接运行 TensorFlow 模型。

因此,如果您需要帮助,您可以在 Bender 中运行TensorFlow中的现有模型,该模型已针对数字识别进行了训练

免责声明:我从事这个项目。

于 2017-06-05T15:38:37.300 回答