0

我需要读取热像图上的最高温度,如下图:

IR_1544_INFRA.jpg

IR_1546_INFRA.jpg

IR_1560_INFRA.jpg

IR_1564_INFRA.jpg

我使用了以下代码,这是最好的结果。我还尝试了其他几种方法,例如:模糊、灰度、二值化等,但都失败了。

import cv2
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r"C:\Users\User\AppData\Local\Tesseract-OCR\tesseract.exe"

# Load image, grayscale, Otsu's threshold
entrada = cv2.imread('IR_1546_INFRA.jpg')

image = entrada[40:65, 277:319]

#image = cv2.imread('IR_1546_INFRA.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = 255 - cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

# Blur and perform text extraction
thresh = cv2.GaussianBlur(thresh, (3,3), 0)
data = pytesseract.image_to_string(thresh, lang='eng', config='--psm 6')
print(data)

cv2.imshow('thresh', thresh)
cv2.waitKey()

在第一张图片中,我发现 了这个

在第二张图片中,我发现了这个

imagem 布局始终相同,即温度始终在同一个位置,因此我裁剪图像以仅隔离数字。我想要(这里是 97.7 这里是 85.2 )。

我的代码需要从这些图像中查找以始终检测此温度并生成一个从最高到最低指示的列表。

在这些图像的情况下,你对我有什么建议来提高 pytesseract 的自信?

注意 1:当我分析整个图像(不裁剪)时,它返回的数据甚至不存在。

注意 2:在某些图像中,即使是二进制数,pytesseract (image_to_string) 也不会返回任何数据。

谢谢大家,对错别字感到抱歉,用英语写作对我来说仍然是一个挑战。

4

1 回答 1

1

因为你有相同的图像,你可以裁剪你想要的区域,然后在那里进行处理。处理也很简单。更改为灰色,获取阈值,反转,调整大小,然后进行 OCR。您可以在下面的代码中看到它。它适用于所有附加的图像。

import cv2
import pytesseract
import os

image_path = "temperature"

for nama_file in sorted(os.listdir(image_path)):
    print(nama_file)

    img = cv2.imread(os.path.join(image_path, nama_file))
    crop = img[43:62, 278:319]
    gray = cv2.cvtColor(crop, cv2.COLOR_BGR2GRAY)
    thresh = cv2.threshold(gray, 200, 255, cv2.THRESH_BINARY)[1]
    thresh = cv2.bitwise_not(thresh)
    double = cv2.resize(thresh, None, fx=2, fy=2)

    custom_config = r'-l eng --oem 3 --psm 7 -c tessedit_char_whitelist="1234567890." '
    text = pytesseract.image_to_string(double, config=custom_config)
    print("detected: " + text)

    cv2.imshow("img", img)
    cv2.imshow("double", double)

    cv2.waitKey(0)

cv2.destroyAllWindows()
于 2020-04-29T07:46:16.360 回答