如何在最新的 python 绑定(cv2)中将蒙版应用于彩色图像?在以前的 python 绑定中,最简单的方法是使用cv.Copy
例如
cv.Copy(dst, src, mask)
但是这个函数在 cv2 绑定中不可用。有没有不使用样板代码的解决方法?
如何在最新的 python 绑定(cv2)中将蒙版应用于彩色图像?在以前的 python 绑定中,最简单的方法是使用cv.Copy
例如
cv.Copy(dst, src, mask)
但是这个函数在 cv2 绑定中不可用。有没有不使用样板代码的解决方法?
cv2.bitwise_and
在这里,如果您已经拥有蒙版图像,则可以使用函数。
检查以下代码:
img = cv2.imread('lena.jpg')
mask = cv2.imread('mask.png',0)
res = cv2.bitwise_and(img,img,mask = mask)
对于 lena 图像和矩形掩码,输出将如下所示。
好吧,如果您希望背景不是纯黑色,这是一个解决方案。我们只需要将蒙版反转并应用到相同大小的背景图像中,然后将背景和前景结合起来。该解决方案的一个优点是背景可以是任何东西(甚至是其他图像)。
这个例子是从Hough Circle Transform修改而来的。第一个图像是 OpenCV 标志,第二个是原始蒙版,第三个是背景 + 前景组合。
# http://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_imgproc/py_houghcircles/py_houghcircles.html
import cv2
import numpy as np
# load the image
img = cv2.imread('E:\\FOTOS\\opencv\\opencv_logo.png')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
# detect circles
gray = cv2.medianBlur(cv2.cvtColor(img, cv2.COLOR_RGB2GRAY), 5)
circles = cv2.HoughCircles(gray, cv2.HOUGH_GRADIENT, 1, 20, param1=50, param2=50, minRadius=0, maxRadius=0)
circles = np.uint16(np.around(circles))
# draw mask
mask = np.full((img.shape[0], img.shape[1]), 0, dtype=np.uint8) # mask is only
for i in circles[0, :]:
cv2.circle(mask, (i[0], i[1]), i[2], (255, 255, 255), -1)
# get first masked value (foreground)
fg = cv2.bitwise_or(img, img, mask=mask)
# get second masked value (background) mask must be inverted
mask = cv2.bitwise_not(mask)
background = np.full(img.shape, 255, dtype=np.uint8)
bk = cv2.bitwise_or(background, background, mask=mask)
# combine foreground+background
final = cv2.bitwise_or(fg, bk)
注意:最好使用 opencv 方法,因为它们已经过优化。
import cv2 as cv
im_color = cv.imread("lena.png", cv.IMREAD_COLOR)
im_gray = cv.cvtColor(im_color, cv.COLOR_BGR2GRAY)
此时你有一个彩色和一个灰色的图像。我们正在处理8-bit
,uint8
图像在这里。这意味着图像可以具有范围内的像素值,[0, 255]
并且值必须是整数。
让我们做一个二进制阈值操作。它创建一个黑白蒙版图像。黑色区域有价值0
,白色区域255
_, mask = cv.threshold(im_gray, thresh=180, maxval=255, type=cv.THRESH_BINARY)
im_thresh_gray = cv.bitwise_and(im_gray, mask)
面具可以在下面的左边看到。右边的图像是bitwise_and
灰度图像和蒙版之间应用运算的结果。发生的事情是,掩码的像素值为零(黑色)的空间位置在结果图像中变为像素值为零。蒙版像素值为 255(白色)的位置,生成的图像保留其原始灰度值。
要将这个蒙版应用于我们的原始彩色图像,我们需要将蒙版转换为 3 通道图像,因为原始彩色图像是 3 通道图像。
mask3 = cv.cvtColor(mask, cv.COLOR_GRAY2BGR) # 3 channel mask
bitwise_and
然后,我们可以使用相同的函数将此 3 通道蒙版应用于我们的彩色图像。
im_thresh_color = cv.bitwise_and(im_color, mask3)
mask3
来自代码的是左下方的图像,并且im_thresh_color
在其右侧。
您可以绘制结果并亲自查看。
cv.imshow("original image", im_color)
cv.imshow("binary mask", mask)
cv.imshow("3 channel mask", mask3)
cv.imshow("im_thresh_gray", im_thresh_gray)
cv.imshow("im_thresh_color", im_thresh_color)
cv.waitKey(0)
原始图像是lenacolor.png
我在这里找到的。
描述的其他方法假定二进制掩码。如果您想使用实值单通道灰度图像作为遮罩(例如来自 alpha 通道),您可以将其扩展为三个通道,然后将其用于插值:
assert len(mask.shape) == 2 and issubclass(mask.dtype.type, np.floating)
assert len(foreground_rgb.shape) == 3
assert len(background_rgb.shape) == 3
alpha3 = np.stack([mask]*3, axis=2)
blended = alpha3 * foreground_rgb + (1. - alpha3) * background_rgb
请注意,mask
需要在范围内0..1
才能使操作成功。还假设1.0
编码只保留前景,而0.0
意味着只保留背景。
如果面具可能有 shape (h, w, 1)
,这有助于:
alpha3 = np.squeeze(np.stack([np.atleast_3d(mask)]*3, axis=2))
如果是,则在这里np.atleast_3d(mask)
制作蒙版,并将结果从to重塑。(h, w, 1)
(h, w)
np.squeeze(...)
(h, w, 3, 1)
(h, w, 3)
Abid Rahman K 给出的答案并不完全正确。我也试过了,发现很有帮助,但卡住了。
这就是我使用给定蒙版复制图像的方式。
x, y = np.where(mask!=0)
pts = zip(x, y)
# Assuming dst and src are of same sizes
for pt in pts:
dst[pt] = src[pt]
这有点慢,但给出了正确的结果。
编辑:
Pythonic 方式。
idx = (mask!=0)
dst[idx] = src[idx]