ruby-on-rails - Tesseract 适用于仅包含且仅包含文本的图像 - 裁剪图像以仅从图像中获取文本部分

Question

Tesseract 适用于仅包含文本的图像。但是如果有文本和图像，而我们只想让文本被识别怎么办。

我正在使用 Tesseract 对图像中的文本进行 OCR 识别。Tesseract 正在从仅包含文本的图像中提供准确的文本。但是，当我检查包含汽车及其车号的图像时，Tesseract 为车号提供了不同的乱码文本。我应用了灰度优化、阈值和其他效果来获得准确的文本输出并提高输出的准确性，但它仍然给出了不同编码混合的不同文本。同样，我正在寻找其他方法来提取此类文本。

谁能知道如何使用 Tesseract OCR 或任何替代方法从此类图像中获取文本，以便仅文本部分保留在图像中，以便 Tesseract 可以在输出中提供准确的文本。

裁剪图像是获取唯一文本的一种替代方法，但如何使用 ImageMagick 或任何其他选项来做到这一点。

谢谢。

score 3 · Accepted Answer

如果您确切知道文本在图像上的位置，则可以将这些区域的坐标与图像一起发送到 Tesseract 以进行识别。看看 Tesseract API 方法TesseractRect或SetRectangle.

ruby-on-rails - Tesseract 适用于仅包含且仅包含文本的图像 - 裁剪图像以仅从图像中获取文本部分

1 回答 1

Related

Reference