1

我有一个大约 320dpi 的图像。我正在裁剪一个部分,使其成为灰度并对其进行二值化(阈值)以使其更清晰。这是它的外观:

在此处输入图像描述

我似乎很清楚,它应该不难识别,但 tesseract 似乎永远无法获得文本。我试过 psm 6,7,8 但没有一个能解决它。

tesseract(v3)不起作用,我做错了什么。

4

1 回答 1

0

你需要申请

准确识别需要上采样。阈值化将使字符的功能可用。

阈值的结果:

在此处输入图像描述

现在你读到:

Allin

代码:


import cv2
import pytesseract

img = cv2.imread('3Po5A.png')
gry = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
(h, w) = gry.shape[:2]
gry = cv2.resize(gry, (w*2, h*2))
thr = cv2.threshold(gry, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]
txt = pytesseract.image_to_string(thr, config="--psm 6")
print(txt)
cv2.imshow("thr", thr)
cv2.waitKey(0)

请注意,您可以使用不同的预处理技术获得相同的结果。

于 2021-02-11T21:19:46.487 回答