我正在使用 Tessearct OCR 来识别图像的字符。但我希望使用 OCR 忽略数字字符
_tesseract->SetVariable("tessedit_char_blacklist", "0123456789");
通过这种方式,OCR 无法识别数字字符,但它为我提供了一些我不想要的其他字符来代替它们。
例如:有一张图片的文字为12 美元,当我在该图片上应用 OCR 时,它为我提供了美元 fl
正如我们在上面看到的那样,OCR 将12转换为我不想要的 fl 。我希望12被 OCR 忽略。
有什么方法可以得到美元而不是 美元 fl 的结果
为我提供任何解决方案。任何帮助都将是可观的。