我需要从 iPhone 上的相机图像中实时识别数字。我知道图像上的数字不会超过 5 位。
考虑到 iPhone 的计算规格,这个问题是否真的可以解决?有没有人有使用 Tesseract OCR 库的经验,你认为可以通过使用它来解决吗?
这取决于您对“实时”的定义,但是是的,应该可以相对快速地识别 iPhone 4 上的数字 0-9,特别是如果您可以使用字体、照明条件等它们会出现在。
我强烈推荐阅读有关Sudoku Grab 如何使用 iPhone 相机识别谜题的文章。在他们的案例中,使用经过训练的神经网络来识别数字,这在现代 iOS 硬件上应该相当简单和快速。
当前的识别库,如 OpenCV,将使用 iPhone 的 CPU 进行处理。我听说他们可以完成更复杂的任务,例如面部识别,速度足以与视频源一起使用,同时显示出最少的口吃。
为了获得更好的性能,我相信新款 iOS 设备上的可编程 GPU 具有很大的潜力。在我的基准测试中,当使用 iPhone 4 的 GPU 进行简单的图像处理时,我看到了 14X - 28X 的加速。虽然现在很少有人关注这个,但像 Sudoku Grab 的神经网络这样的东西应该是一个足够并行的过程,可以从在 GPU 上运行中受益。
它应该在计算上是可能的。有可以实时获取条形码的应用程序,也有可以进行实时翻译的应用程序。(字镜头)。但是,我不确定他们使用什么库。
有免费的 SDK:http ://rtrsdk.com/支持 iOS 和 Andorid,实时工作,帮助您捕获任何文本,数字应该不是问题。
免责声明:我为 ABBYY 工作
是的。本德尔可以帮助你。它可以让你在 iOS 上构建和运行神经网络。由于它在引擎盖下使用金属,因此运行快速且平稳。它还支持直接运行 TensorFlow 模型。
因此,如果您需要帮助,您可以在 Bender 中运行TensorFlow中的现有模型,该模型已针对数字识别进行了训练
免责声明:我从事这个项目。