1

所以,我有这个平面图

我想改变它的颜色,这样我就可以使用 OCR 来读取房间号。为此,我想做以下事情:将所有红色更改为白色,将所有其他颜色更改为黑色,所以剩下的就是房间号。我想尝试阈值化,但我在文档中看到它只能在灰度图像上完成,所以我首先运行以下代码对其进行灰度化:

    import cv2
    import os
    from ConvertSVG import svg_2_png

    # Convert the SVG to a PNG
    output_path = os.path.join('converted svgs', 'Andover HS Level 3.png')

    svg_2_png(os.path.join('svg', 'Andover HS Level 3.svg'), output_path)

    img = cv2.imread(output_path)
    gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    cv2.imshow("Grayscale", gray_image)

    cv2.waitKey(0)

我得到了这个输出

如您所见,灰度确实有效,但房间号变得越来越难读,OCR 难以读取。

我如何使用 OpenCV-python 将所有红色变为白色,将所有其他颜色变为黑色,尽可能少地“阻塞”?

4

1 回答 1

2

这是一种应该可以很好地工作的方法:

结果:

代码:

import cv2
import numpy as np

# load image in BGR
input_image = cv2.imread("floorplan.png").astype(np.float32) / 255.0

# get scalar redness - this is smooth and mostly correct, 
# but it includes lots of stuff we don't want
redness = input_image[:, :, 2] - np.mean(input_image[:, :, :2], -1)

# create a blocky mask around the highly-red pixels
mask_coarse = cv2.dilate((redness > 0.7).astype(np.uint8), np.ones((3, 3)), iterations=5)
mask_fine = cv2.dilate(
    (mask_coarse * (redness > 0.3)).astype(np.uint8), np.ones((3, 3)), iterations=2
)

# mask redness with the blocky mask
output = redness * mask_fine * 255

cv2.imwrite("mask.png", output)
于 2018-08-11T16:38:24.027 回答