有谁知道如何为 Pytesseract 设置字符白名单?我希望它只输出 Az 和 0-9。这可能吗?我有以下内容:
img = Image.open('test.jpg')
result = pytesseract.image_to_string(img, config='-psm 6')
我得到了其他字符,例如 / 代表 1,所以我想限制可能字符的选项。
有谁知道如何为 Pytesseract 设置字符白名单?我希望它只输出 Az 和 0-9。这可能吗?我有以下内容:
img = Image.open('test.jpg')
result = pytesseract.image_to_string(img, config='-psm 6')
我得到了其他字符,例如 / 代表 1,所以我想限制可能字符的选项。
您可以使用以下行来完成此操作。或者您可以为 tesseract 设置配置文件来执行限制字符 tesseract 正在寻找的相同的事情
pytesseract.image_to_string(question_img, config="-c tessedit_char_whitelist=0123456789abcdefghijklmnopqrstuvwxyz -psm 6")
我相信还有其他方法可以让它工作,但这对我有用。