3

在使用tesseract-OCR引擎提取文本之前,我使用ImageMagick对收据图像进行预处理。我已经使用去除了图像中的噪点

convert input.png -colorspace gray \
  \( +clone -blur 0x2 \) +swap -compose divide -composite \
  -linear-stretch 5%x0%   photocopy.png

现在,我需要用文本裁剪区域。ImageMagick 具有从图像中删除边框的遮罩功能,但在我的情况下,由于收据图像的背景不均匀,创建遮罩似乎不起作用。

我已经通过 SWT ' Stroke Width Transform'从这里识别自然图像中的文本'这可以通过 imagemagick (可能是其他方便的开发人员图像处理工具)来识别文本以便可以省略边框吗?提前致谢。

4

0 回答 0