python-3.x - 如何使 pytesseract 正确读取 slahed 0

Question

我正在尝试读取图像上的电话号码。由于图像非常清晰，我没有应用任何预处理但 pytesseract 有时无法正确识别 0。我试图训练类似的字体，但它给出了相同的结果。一个例子是这张图片

我的代码非常简单：

image=Image.open('Fotolar/0.png')
custom_config = r'--oem 3 --psm 6'
pytesseract.image_to_string(image,config=custom_config)

我得到这个结果：'9543 684 9993'

我尝试对我的图像进行微调，但我做不到，因为所有教程都是基于 ubuntu 的，我不熟悉它。你有什么建议吗？

score 0 · Accepted Answer

教程很清楚。如果您想像我一样进行微调，请在教程中添加一些变量，例如“START_MODEL”，而不是键入“make training”。

如果您的问题与我的问题相同，您也可以使用我的 slashedzero.traineddata https://github.com/yusufuyanik1/SlashedZeroOCR。

1 回答 1