我最近遇到了Tesseract和OpenCV。看起来 Tesseract 是一个成熟的 OCR 引擎,OpenCV 可以用作创建 OCR 应用程序/服务的框架。
我尝试在我的一些图像上使用 Tesseract,它的准确性似乎不错。后来,我偶然发现了一个非常简单的使用 OpenCV 使用 Python 执行 OCR的教程,印象深刻。几分钟后,我完成了系统的训练,它的准确性很好。但是,当然,采用这种方法意味着我需要使用大型训练集来广泛训练我的系统。
我的具体问题如下:
- 如何在 Tesseract 和使用 OpenCV 构建自定义 OCR 应用程序之间进行选择?
- 有可用于不同语言的 Tesseract 的训练数据集。OpenCV 是否有类似的东西,所以我不必从头开始实现 OCR?
- 哪个更适合想要成为商业应用程序?
有什么建议么?