2

tesseract 无法识别某些文本图像。

例如,考虑以下rails无法被 tesseract 识别的图像

在此处输入图像描述

上面的图像在 OCRed 时没有输出。

有些图像的准确性不达标。

我正在使用 ruby​​ on rails 并实现 tesseract OCR 文本识别我正在使用“gem tesseract”和一些代码。有什么问题,如何获得准确的输出。

4

1 回答 1

2

问题是 Tesseract 适用于只有文本的图像。不保证您发布的图像的结果。

您将需要进行一些图像处理(将图像裁剪为仅文本部分),并将图像转换为白色背景上的黑色文本。

于 2012-12-11T07:55:45.473 回答