1

我试图理解我在 Rosettacode.org 上找到的 Python 中 Canny 运算符的这种实现,但不明白它是如何计算 thetaQ 的。为什么它在这个公式中使用 5 以及它如何量化方向?有人可以帮我吗?

#!/bin/python
import numpy as np
from scipy.ndimage.filters import convolve, gaussian_filter
from scipy.misc import imread, imshow

def CannyEdgeDetector(im, blur = 1, highThreshold = 91, lowThreshold = 31):
    im = np.array(im, dtype=float) #Convert to float to prevent clipping values

    #Gaussian blur to reduce noise
    im2 = gaussian_filter(im, blur)

    #Use sobel filters to get horizontal and vertical gradients
    im3h = convolve(im2,[[-1,0,1],[-2,0,2],[-1,0,1]]) 
    im3v = convolve(im2,[[1,2,1],[0,0,0],[-1,-2,-1]])

    #Get gradient and direction
    grad = np.power(np.power(im3h, 2.0) + np.power(im3v, 2.0), 0.5)
    theta = np.arctan2(im3v, im3h)
    thetaQ = (np.round(theta * (5.0 / np.pi)) + 5) % 5 #Quantize direction

    #Non-maximum suppression
    gradSup = grad.copy()
    for r in range(im.shape[0]):
        for c in range(im.shape[1]):
            #Suppress pixels at the image edge
            if r == 0 or r == im.shape[0]-1 or c == 0 or c == im.shape[1] - 1:
                gradSup[r, c] = 0
                continue
            tq = thetaQ[r, c] % 4

            if tq == 0: #0 is E-W (horizontal)
                if grad[r, c] <= grad[r, c-1] or grad[r, c] <= grad[r, c+1]:
                    gradSup[r, c] = 0
            if tq == 1: #1 is NE-SW
                if grad[r, c] <= grad[r-1, c+1] or grad[r, c] <= grad[r+1, c-1]:
                    gradSup[r, c] = 0
            if tq == 2: #2 is N-S (vertical)
                if grad[r, c] <= grad[r-1, c] or grad[r, c] <= grad[r+1, c]:
                    gradSup[r, c] = 0
            if tq == 3: #3 is NW-SE
                if grad[r, c] <= grad[r-1, c-1] or grad[r, c] <= grad[r+1, c+1]:
                    gradSup[r, c] = 0

.........
4

1 回答 1

2

atan2返回 [-π,π] 范围内的值。该公式(np.round(theta * (5.0 / np.pi)) + 5)将其转换为范围 [0,10],并带有四舍五入的值。然后他们取模 5 的值,得到一个 [0,4] 范围内的整数,将 5 和 10 映射到 0、6 到 1 等。也就是说,0、-π 和 π 都映射到同一个整数. 后来他们取那个值以 4 为模,将 4 映射到 0。这是我不明白的部分。这对我来说似乎是错误的。这是映射:

将角度映射到整数的图

您可以看到,刚好高于 π/2 的值被映射为 3,而刚好低于 π/2 的值被映射为 2。此外,映射到 0 的角度范围是映射到其他角度的范围的两倍。我会以不同的方式对这些角度进行四舍五入。

在任何情况下,Canny 滤波器的典型实现都不会量化角度,而是使用插值来读取像素之间的值。

此外,使用 Sobel 滤波器计算导数很奇怪,特别是因为它们是在高斯滤波器之后应用的。此处应使用高斯滤波器的导数,以一步平滑和计算导数。

于 2017-11-02T04:26:32.547 回答