2

Tesseract 适用于仅包含文本的图像。但是如果有文本和图像,而我们只想让文本被识别怎么办。

我正在使用 Tesseract 对图像中的文本进行 OCR 识别。Tesseract 正在从仅包含文本的图像中提供准确的文本。但是,当我检查包含汽车及其车号的图像时,T​​esseract 为车号提供了不同的乱码文本。我应用了灰度优化、阈值和其他效果来获得准确的文本输出并提高输出的准确性,但它仍然给出了不同编码混合的不同文本。同样,我正在寻找其他方法来提取此类文本。

谁能知道如何使用 Tesseract OCR 或任何替代方法从此类图像中获取文本,以便仅文本部分保留在图像中,以便 Tesseract 可以在输出中提供准确的文本。

裁剪图像是获取唯一文本的一种替代方法,但如何使用 ImageMagick 或任何其他选项来做到这一点。

谢谢。

4

1 回答 1

3

如果您确切知道文本在图像上的位置,则可以将这些区域的坐标与图像一起发送到 Tesseract 以进行识别。看看 Tesseract API 方法TesseractRectSetRectangle.

于 2012-11-30T02:02:59.893 回答