我正在使用 Microsoft OCR 库来阅读文本。
Microsoft OCR 库完美运行。但是我想阅读链接http://www.ict4u.net/databases/database-images/micr.jpg中给出的以下字符列表。有没有一种方法可以训练 OCR 库读取以下字符,或者是否有一种语言可以读取以下字符。
我正在使用 Microsoft OCR 库来阅读文本。
Microsoft OCR 库完美运行。但是我想阅读链接http://www.ict4u.net/databases/database-images/micr.jpg中给出的以下字符列表。有没有一种方法可以训练 OCR 库读取以下字符,或者是否有一种语言可以读取以下字符。
[此处的 Microsoft OCR 工作人员] 我们尚不支持培训 OCR 以针对您的用例对其进行自定义。但是,我们确实积极关注 stackoverflow 以了解开发人员需要什么,因此我们可以不断改进 OCR 引擎。
我已经使用 Microsoft OCR 有一段时间了。与 Tesseract 相比,它具有非常基本的功能。
例如,Microsoft OCR 返回单词和行。但台词是胡说八道。随机将 2 或 3 个单词组合在一起作为“线”,但它们不是真正的线。而且“线条”是完全无序的。在这方面它比 Tesseract 差。您必须获取每个单词的坐标并自行排序。
Microsoft 不会返回字符的矩形,并且绝对无法以任何方式配置或训练 Microsoft OCR。您可以使用 Windows 更新为“基本打字”= OCR 添加语言(请参阅http://www.thewindowsclub.com/install-uninstall-languages-windows-10),但您无法训练自己的语言数据。
MSDN表示支持以下 25 种语言,但准确度不同:
识别质量与 Tesseract 非常相似。它甚至有与 Tesseract 完全相同的问题。某些单个字符无法识别(单独的符号,例如单个“$”),并且星号与 Tesseract 存在相同的巨大问题。它还会像 Tesseract 那样在错误的位置插入空格。所以我问自己微软是否在后台使用 Tesseract?
但是,Microsoft OCR 比 Tesseract 有一个优势:图像预处理要好得多。无论您是黄色背景上的红色文本还是黑色背景上的白色文本都没有关系。这是 Tesseract 的一个陷阱,它需要一个高质量的黑白图像作为输入。
两个 OCR 库都适用:如果您有识别问题,请尝试放大图像。甚至模糊图像也可能非常有用,因为这可以消除图像中的噪点。