我有一个大约 320dpi 的图像。我正在裁剪一个部分,使其成为灰度并对其进行二值化(阈值)以使其更清晰。这是它的外观:
我似乎很清楚,它应该不难识别,但 tesseract 似乎永远无法获得文本。我试过 psm 6,7,8 但没有一个能解决它。
tesseract(v3)不起作用,我做错了什么。
我有一个大约 320dpi 的图像。我正在裁剪一个部分,使其成为灰度并对其进行二值化(阈值)以使其更清晰。这是它的外观:
我似乎很清楚,它应该不难识别,但 tesseract 似乎永远无法获得文本。我试过 psm 6,7,8 但没有一个能解决它。
tesseract(v3)不起作用,我做错了什么。
你需要申请
准确识别需要上采样。阈值化将使字符的功能可用。
阈值的结果:
现在你读到:
Allin
代码:
import cv2
import pytesseract
img = cv2.imread('3Po5A.png')
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
(h, w) = gry.shape[:2]
gry = cv2.resize(gry, (w*2, h*2))
thr = cv2.threshold(gry, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]
txt = pytesseract.image_to_string(thr, config="--psm 6")
print(txt)
cv2.imshow("thr", thr)
cv2.waitKey(0)
请注意,您可以使用不同的预处理技术获得相同的结果。