我有一些仅包含数字的产品标签样本。但是我设法处理了这些图像,以便我可以使用这些图像来识别数字。我使用了经过英语训练的数据文件,但结果非常糟糕。有没有办法可以使用模板图像训练数据集。
我已经参考了训练 tesseract 的文档,但我无法使用这些图像进行训练。
但是在拥有盒子文件之后,我该如何制作 eng.traineddata。
有人可以帮帮我吗。
这是产品标签的裁剪原始图像http://imgur.com/hNNlX9g
这是产品标签的处理图像http://imgur.com/Kzxtu0M