0

我正在尝试读取图像上的电话号码。由于图像非常清晰,我没有应用任何预处理但 pytesseract 有时无法正确识别 0。我试图训练类似的字体,但它给出了相同的结果。一个例子是 这张图片

我的代码非常简单:

image=Image.open('Fotolar/0.png')
custom_config = r'--oem 3 --psm 6'
pytesseract.image_to_string(image,config=custom_config)

我得到这个结果:'9543 684 9993'

我尝试对我的图像进行微调,但我做不到,因为所有教程都是基于 ubuntu 的,我不熟悉它。你有什么建议吗?

4

1 回答 1

0

我按照本教程https://www.youtube.com/watch?v=JPDeiGc2an8&t=444s并在此 repo https://github.com/kevinbicycle/ocrd-train上使用了文件和说明。

教程很清楚。如果您想像我一样进行微调,请在教程中添加一些变量,例如“START_MODEL”,而不是键入“make training”。

如果您的问题与我的问题相同,您也可以使用我的 slashedzero.traineddata https://github.com/yusufuyanik1/SlashedZeroOCR

于 2020-08-14T06:20:14.607 回答