1

我正在使用 Java 和 Tess4J 进行文本识别。我识别黑色和红色图像(分别),都是白色背景,非常清晰。对于黑色的,它可以完美地工作,但对于红色的,tesseract 简直是疯了。我尝试添加变量(“editor_image_text_color”,“RED”),但它根本没有帮助。现在,我为红色做的是扫描整个图像并将每个红色像素设置为黑色,我发现这非常低效,因为我需要对每个像素进行一些计算,因为图片具有不同的红色强度,我必须保存。非常感谢!

例如: http: //imageshack.us/photo/my-images/593/3eu9.png/总是给我一个 9,但 http://imageshack.us/photo/my-images/818/efxf.png /没有,就像它在预处理中丢失了数字一样,因为黑色的效果非常好,但红色的并不比随机数好。

4

2 回答 2

1

感谢 nguyenq 的回答,我尝试了该功能,但效果不佳,但在检查了 ImageHelper 类后,我使用了该方法:

ImageHelper.convertImageToBinary(BufferedImage image)

而且效果很好,谢谢!

于 2013-09-15T10:40:49.183 回答
1

尝试使用ImageHelper.convertImageToGrayscale(BufferedImage image)方法将彩色图像转换为灰度。

于 2013-09-14T18:00:54.230 回答