Tesseract 适用于仅包含文本的图像。但是如果有文本和图像,而我们只想让文本被识别怎么办。
我正在使用 Tesseract 对图像中的文本进行 OCR 识别。Tesseract 正在从仅包含文本的图像中提供准确的文本。但是,当我检查包含汽车及其车号的图像时,Tesseract 为车号提供了不同的乱码文本。我应用了灰度优化、阈值和其他效果来获得准确的文本输出并提高输出的准确性,但它仍然给出了不同编码混合的不同文本。同样,我正在寻找其他方法来提取此类文本。
谁能知道如何使用 Tesseract OCR 或任何替代方法从此类图像中获取文本,以便仅文本部分保留在图像中,以便 Tesseract 可以在输出中提供准确的文本。
裁剪图像是获取唯一文本的一种替代方法,但如何使用 ImageMagick 或任何其他选项来做到这一点。
谢谢。