我正在使用 OpenCV 为 Android 写作。我正在使用标记控制的分水岭分割类似于下面的图像,而无需用户手动标记图像。我打算使用区域最大值作为标记。
minMaxLoc()
会给我价值,但我怎样才能将它限制在我感兴趣的斑点上?我可以利用来自findContours()
或 cvBlob blobs 的结果来限制 ROI 并将最大值应用于每个 blob 吗?
我正在使用 OpenCV 为 Android 写作。我正在使用标记控制的分水岭分割类似于下面的图像,而无需用户手动标记图像。我打算使用区域最大值作为标记。
minMaxLoc()
会给我价值,但我怎样才能将它限制在我感兴趣的斑点上?我可以利用来自findContours()
或 cvBlob blobs 的结果来限制 ROI 并将最大值应用于每个 blob 吗?
首先:该函数minMaxLoc
仅找到给定输入的全局最小值和全局最大值,因此对于确定区域最小值和/或区域最大值几乎没有用处。但是您的想法是正确的,基于区域最小值/最大值提取标记以执行基于标记的分水岭变换是完全可以的。让我试着澄清一下什么是分水岭变换,以及你应该如何正确使用 OpenCV 中的实现。
一些涉及分水岭的论文的描述与以下类似(如果您不确定,我可能会错过一些细节:问)。考虑您知道的某个区域的表面,它包含山谷和山峰(以及其他与我们无关的细节)。假设在这个表面之下你只有水,有颜色的水。现在,在你表面的每个山谷打洞,然后水开始填满整个区域。在某些时候,不同颜色的水会相遇,当这种情况发生时,你会建造一座水坝,使它们不会相互接触。最后你有一个水坝的集合,这是分隔所有不同颜色的水的分水岭。
现在,如果你在那个表面上打了太多的洞,你最终会得到太多的区域:过度分割。如果你做的太少,你会得到一个细分不足。因此,几乎所有建议使用分水岭的论文实际上都提出了避免该论文处理的应用程序出现这些问题的技术。
我写了所有这些(对于任何知道分水岭转换的人来说可能太天真了),因为它直接反映了你应该如何使用分水岭实现(当前接受的答案是以完全错误的方式做的)。现在让我们从使用 Python 绑定的 OpenCV 示例开始。
问题中呈现的图像由许多物体组成,这些物体大多靠得太近,在某些情况下重叠。分水岭在这里的用处是正确地分离这些对象,而不是将它们组合成单个组件。因此,每个对象至少需要一个标记,背景需要好的标记。例如,首先通过 Otsu 对输入图像进行二值化,然后执行形态学打开以去除小物体。此步骤的结果如下左图所示。现在对于二值图像,考虑对其应用距离变换,结果如右图。
通过距离变换结果,我们可以考虑一些阈值,以便我们只考虑距离背景最远的区域(下图左)。这样做,我们可以通过在较早的阈值之后标记不同的区域来获得每个对象的标记。现在,我们还可以考虑上面左图的放大版本的边框来组成我们的标记。完整的标记如下右图所示(有些标记太暗而无法看到,但左图中的每个白色区域都显示在右图中)。
我们这里的这个标记很有意义。每个都colored water == one marker
将开始填充该区域,流域转换将建造水坝以阻止不同的“颜色”融合。如果我们进行变换,我们会得到左边的图像。通过将它们与原始图像组合来仅考虑水坝,我们得到了正确的结果。
import sys
import cv2
import numpy
from scipy.ndimage import label
def segment_on_dt(a, img):
border = cv2.dilate(img, None, iterations=5)
border = border - cv2.erode(border, None)
dt = cv2.distanceTransform(img, 2, 3)
dt = ((dt - dt.min()) / (dt.max() - dt.min()) * 255).astype(numpy.uint8)
_, dt = cv2.threshold(dt, 180, 255, cv2.THRESH_BINARY)
lbl, ncc = label(dt)
lbl = lbl * (255 / (ncc + 1))
# Completing the markers now.
lbl[border == 255] = 255
lbl = lbl.astype(numpy.int32)
cv2.watershed(a, lbl)
lbl[lbl == -1] = 0
lbl = lbl.astype(numpy.uint8)
return 255 - lbl
img = cv2.imread(sys.argv[1])
# Pre-processing.
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
_, img_bin = cv2.threshold(img_gray, 0, 255,
cv2.THRESH_OTSU)
img_bin = cv2.morphologyEx(img_bin, cv2.MORPH_OPEN,
numpy.ones((3, 3), dtype=int))
result = segment_on_dt(img, img_bin)
cv2.imwrite(sys.argv[2], result)
result[result != 255] = 0
result = cv2.dilate(result, None)
img[result == 255] = (0, 0, 255)
cv2.imwrite(sys.argv[3], img)
我想在这里解释一个关于如何使用分水岭的简单代码。我正在使用 OpenCV-Python,但我希望你不会有任何理解困难。
在这段代码中,我将使用分水岭作为前景-背景提取的工具。(此示例是 OpenCV 食谱中 C++ 代码的 Python 对应物)。这是一个理解分水岭的简单案例。除此之外,您可以使用分水岭来计算此图像中的对象数量。这将是此代码的稍微高级的版本。
1 - 首先我们加载我们的图像,将其转换为灰度,并使用合适的值对其进行阈值处理。我采用了Otsu 的二值化,因此它会找到最佳阈值。
import cv2
import numpy as np
img = cv2.imread('sofwatershed.jpg')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
ret,thresh = cv2.threshold(gray,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
下面是我得到的结果:
(即使结果很好,因为前景和背景图像之间的对比度很大)
2 - 现在我们必须创建标记。标记是与原始图像大小相同的图像,即 32SC1(32 位有符号单通道)。
现在,原始图像中会有一些区域,您可以确定该部分属于前景。在标记图像中用 255 标记这样的区域。现在你确定是背景的区域用128标记。你不确定的区域用0标记。这是我们接下来要做的。
A - 前景区域:- 我们已经得到了一个阈值图像,其中药丸是白色的。我们稍微侵蚀它们,以便我们确定剩余区域属于前景。
fg = cv2.erode(thresh,None,iterations = 2)
FG:
B - 背景区域:- 这里我们扩大阈值图像,以减少背景区域。但我们确信剩余的黑色区域是 100% 背景。我们将其设置为 128。
bgt = cv2.dilate(thresh,None,iterations = 3)
ret,bg = cv2.threshold(bgt,1,128,1)
现在我们得到bg如下:
C - 现在我们添加 fg 和 bg:
marker = cv2.add(fg,bg)
下面是我们得到的:
现在我们可以从上图中清楚地看出,白色区域是 100% 前景,灰色区域是 100% 背景,黑色区域我们不确定。
然后我们将其转换为 32SC1 :
marker32 = np.int32(marker)
3 - 最后我们应用分水岭并将结果转换回uint8图像:
cv2.watershed(img,marker32)
m = cv2.convertScaleAbs(marker32)
米:
4 -我们对它进行适当的阈值化以获得掩码并bitwise_and
使用输入图像执行:
ret,thresh = cv2.threshold(m,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
res = cv2.bitwise_and(img,img,mask = thresh)
资源:
希望能帮助到你!!!
方舟
前言
我之所以加入,主要是因为我发现OpenCV 文档(和C++ 示例)中的分水岭教程以及上面 mmgp 的答案都非常令人困惑。我多次重新审视分水岭方法,最终因沮丧而放弃。我终于意识到我至少需要尝试一下这种方法并看到它的实际效果。这是我整理了我遇到的所有教程后想出的。
除了作为计算机视觉新手之外,我的大部分麻烦可能与我使用 OpenCVSharp 库而不是 Python 的要求有关。C# 没有像 NumPy 中那样内置的高功率数组运算符(尽管我意识到这是通过 IronPython 移植的),所以我在理解和在 C# 中实现这些操作方面都遇到了很多困难。另外,郑重声明,我真的很鄙视这些函数调用中的细微差别和不一致之处。OpenCVSharp 是我用过的最脆弱的库之一。但是,嘿,这是一个港口,所以我在期待什么?最重要的是——它是免费的。
事不宜迟,让我们谈谈我对分水岭的 OpenCVSharp 实现,并希望在总体上阐明分水岭实现的一些棘手点。
应用
首先,确保分水岭是您想要的并了解它的用途。我正在使用染色的细胞板,比如这个:
我花了很长时间才弄清楚我不能只打一个分水岭来区分该领域的每个细胞。相反,我首先必须隔离一部分字段,然后在这小部分上调用分水岭。我通过一些过滤器隔离了我的感兴趣区域(ROI),我将在这里简要解释一下:
一旦我们清理了上述阈值操作产生的轮廓,就该寻找分水岭的候选者了。就我而言,我只是遍历了所有大于某个区域的轮廓。
代码
假设我们已经从上述字段中分离出这个轮廓作为我们的 ROI:
让我们看看我们将如何编写分水岭。
我们将从一个空白垫子开始,只绘制定义我们 ROI 的轮廓:
var isolatedContour = new Mat(source.Size(), MatType.CV_8UC1, new Scalar(0, 0, 0));
Cv2.DrawContours(isolatedContour, new List<List<Point>> { contour }, -1, new Scalar(255, 255, 255), -1);
为了使分水岭调用起作用,它需要一些关于投资回报率的“提示”。如果您像我一样是一个完整的初学者,我建议您查看CMM 分水岭页面以快速入门。可以说我们将通过在右侧创建形状来在左侧创建有关 ROI 的提示:
要创建此“提示”形状的白色部分(或“背景”),我们将Dilate
像这样创建孤立的形状:
var kernel = Cv2.GetStructuringElement(MorphShapes.Ellipse, new Size(2, 2));
var background = new Mat();
Cv2.Dilate(isolatedContour, background, kernel, iterations: 8);
要在中间(或“前景”)创建黑色部分,我们将使用距离变换后跟阈值,它将我们从左侧的形状带到右侧的形状:
这需要几个步骤,您可能需要调整阈值的下限以获得适合您的结果:
var foreground = new Mat(source.Size(), MatType.CV_8UC1);
Cv2.DistanceTransform(isolatedContour, foreground, DistanceTypes.L2, DistanceMaskSize.Mask5);
Cv2.Normalize(foreground, foreground, 0, 1, NormTypes.MinMax); //Remember to normalize!
foreground.ConvertTo(foreground, MatType.CV_8UC1, 255, 0);
Cv2.Threshold(foreground, foreground, 150, 255, ThresholdTypes.Binary);
然后我们将减去这两个垫子,得到我们的“提示”形状的最终结果:
var unknown = new Mat(); //this variable is also named "border" in some examples
Cv2.Subtract(background, foreground, unknown);
同样,如果我们Cv2.ImShow
unknown,它看起来像这样:
好的!这对我来说很容易缠住我的头。然而,下一部分让我很困惑。让我们看看将我们的“提示”变成Watershed
函数可以使用的东西。为此,我们需要使用ConnectedComponents
,它基本上是一个根据索引分组的大像素矩阵。例如,如果我们有一个带有字母“HI”的垫子,ConnectedComponents
可能会返回这个矩阵:
0 0 0 0 0 0 0 0 0
0 1 0 1 0 2 2 2 0
0 1 0 1 0 0 2 0 0
0 1 1 1 0 0 2 0 0
0 1 0 1 0 0 2 0 0
0 1 0 1 0 2 2 2 0
0 0 0 0 0 0 0 0 0
所以,0是背景,1是字母“H”,2是字母“I”。(如果您到了这一点并想要可视化您的矩阵,我建议您查看这个有启发性的答案。)现在,我们将使用ConnectedComponents
以下方法为分水岭创建标记(或标签):
var labels = new Mat(); //also called "markers" in some examples
Cv2.ConnectedComponents(foreground, labels);
labels = labels + 1;
//this is a much more verbose port of numpy's: labels[unknown==255] = 0
for (int x = 0; x < labels.Width; x++)
{
for (int y = 0; y < labels.Height; y++)
{
//You may be able to just send "int" in rather than "char" here:
var labelPixel = (int)labels.At<char>(y, x); //note: x and y are inexplicably
var borderPixel = (int)unknown.At<char>(y, x); //and infuriatingly reversed
if (borderPixel == 255)
labels.Set(y, x, 0);
}
}
请注意,分水岭函数要求边界区域用 0 标记。因此,我们在标签/标记数组中将任何边界像素设置为 0。
在这一点上,我们应该都准备好调用了Watershed
。但是,在我的特定应用程序中,仅在此调用期间可视化整个源图像的一小部分很有用。这对您来说可能是可选的,但我首先通过扩展它来掩盖一小部分源:
var mask = new Mat();
Cv2.Dilate(isolatedContour, mask, new Mat(), iterations: 20);
var sourceCrop = new Mat(source.Size(), source.Type(), new Scalar(0, 0, 0));
source.CopyTo(sourceCrop, mask);
然后打个神奇的电话:
Cv2.Watershed(sourceCrop, labels);
结果
上面的Watershed
调用将labels
就地修改。您必须回过头来记住由ConnectedComponents
. 这里的区别是,如果分水岭在分水岭之间发现任何水坝,它们将在该矩阵中标记为“-1”。与ConnectedComponents
结果一样,不同的分水岭将以类似的递增数字方式进行标记。出于我的目的,我想将它们存储到单独的轮廓中,所以我创建了这个循环来拆分它们:
var watershedContours = new List<Tuple<int, List<Point>>>();
for (int x = 0; x < labels.Width; x++)
{
for (int y = 0; y < labels.Height; y++)
{
var labelPixel = labels.At<Int32>(y, x); //note: x, y switched
var connected = watershedContours.Where(t => t.Item1 == labelPixel).FirstOrDefault();
if (connected == null)
{
connected = new Tuple<int, List<Point>>(labelPixel, new List<Point>());
watershedContours.Add(connected);
}
connected.Item2.Add(new Point(x, y));
if (labelPixel == -1)
sourceCrop.Set(y, x, new Vec3b(0, 255, 255));
}
}
然后,我想用随机颜色打印这些轮廓,所以我创建了以下垫子:
var watershed = new Mat(source.Size(), MatType.CV_8UC3, new Scalar(0, 0, 0));
foreach (var component in watershedContours)
{
if (component.Item2.Count < (labels.Width * labels.Height) / 4 && component.Item1 >= 0)
{
var color = GetRandomColor();
foreach (var point in component.Item2)
watershed.Set(point.Y, point.X, color);
}
}
显示时会产生以下结果:
如果我们在源图像上绘制之前用 -1 标记的水坝,我们会得到:
编辑:
我忘了注意:确保你在用完垫子后清理它们。它们将留在内存中,OpenCVSharp 可能会出现一些难以理解的错误消息。我真的应该在using
上面使用,但mat.Release()
也是一种选择。
此外,上面 mmgp 的答案包括这一行:dt = ((dt - dt.min()) / (dt.max() - dt.min()) * 255).astype(numpy.uint8)
,这是应用于距离变换结果的直方图拉伸步骤。出于多种原因,我省略了这一步(主要是因为我不认为我看到的直方图太窄而无法开始),但你的里程可能会有所不同。