这个问答主题似乎一直是 iOS 上 OCR 主题的热门搜索之一,但已经过时了,所以我想我会发布一些其他资源,这些资源可能对我来说是有用的写这篇文章的时间:
Vision Framework
https://developer.apple.com/documentation/vision
从 iOS 11 开始,您现在可以使用包含的基于 CoreML 的 Vision 框架来进行矩形或文本检测。我发现我不再需要将 OpenCV 与操作系统中包含的这些功能一起使用。但是,请注意,文本检测与文本识别或 OCR 不同,因此您仍需要另一个库,如 Tesseract(或您自己的 CoreML 模型)来将检测到的图像部分转换为实际文本。
SwiftOCR
https://github.com/garnele007/SwiftOCR
如果你只是对识别字母数字代码感兴趣,这个 OCR 库声称比 Tesseract 显着提高了速度、内存消耗和准确性(我自己没有尝试过)。
ML Kit
https://firebase.google.com/products/ml-kit/
Google 已发布 ML Kit 作为其 Firebase 开发人员工具套件的一部分,在撰写本文时处于测试阶段。与 Apple 的 CoreML 类似,它是一个机器学习框架,可以使用您自己训练过的模型,但也有预训练过的模型用于常见的图像处理任务,如 Vision Framework。与Vision Framework 不同,它还包括一个用于在设备上识别拉丁字符的模型。目前,该库的使用是免费的用于设备上的功能,使用 Google 提供的云/SAAS API 产品需要付费。我选择在我的项目中使用它,因为识别的速度和准确性似乎相当不错,而且我还将创建一个具有相同功能的 Android 应用程序,因此拥有一个单一的跨平台解决方案对我来说是理想的。
ABBYY 实时识别 SDK
https://rtrsdk.com/
这个适用于 iOS 和 Android 的商业 SDK 可免费下载用于评估和有限的商业用途(截至撰写本文时最多 5000 个单位)。进一步的商业用途需要扩展许可。由于定价不透明,我没有评估此产品。