13

有谁知道如何为 Pytesseract 设置字符白名单?我希望它只输出 Az 和 0-9。这可能吗?我有以下内容:

img = Image.open('test.jpg')
result = pytesseract.image_to_string(img, config='-psm 6')

我得到了其他字符,例如 / 代表 1,所以我想限制可能字符的选项。

4

1 回答 1

24

您可以使用以下行来完成此操作。或者您可以为 tesseract 设置配置文件来执行限制字符 tesseract 正在寻找的相同的事情

pytesseract.image_to_string(question_img, config="-c tessedit_char_whitelist=0123456789abcdefghijklmnopqrstuvwxyz -psm 6")

我相信还有其他方法可以让它工作,但这对我有用。

于 2017-04-30T18:47:32.920 回答