0

我需要从图像中获取文本,但在我的图像中它只有一个数字,它可能是 1-9 之间的任何数字,我需要获取该数字。我正在使用 pytesseract 来执行此操作,但在阅读时显示空文本。下面是我的形象:

单个字母/数字图像

以下是我正在尝试的:

from PIL import Image, ImageEnhance, ImageFilter
import pytesseract


def getText(image):
    image = Image.open(image)
    image.show()
    image = image.point(lambda x: 0 if x < 143 else 255)  # To clean Image
#     text = pytesseract.image_to_string(image).encode('utf-8').strip()
    text = pytesseract.image_to_string(image)
    return text


image1 = '/home/einfochips/Documents/Kroger_Automation_Framework/src/main/scripts/background.png'
txt1 = getText(image1)
print txt1, '_______________', type(txt1), len(txt1)
4

1 回答 1

0

您需要设置您的 psm 值。默认值为模式 0(我相信)。

这对我有用 text = pytesseract.image_to_string(Image.open(filename),config='--psm 10')

于 2018-11-02T19:01:16.080 回答