python - 相位相关

Question

如何通过 2 张图像的相位相关（使用 fft）确定旋转角度？http://en.wikipedia.org/wiki/Phase_correlation中给出的算法返回线性移位，而不是角度。它还提到必须将图像转换为对数极坐标来计算旋转。这种转换是如何在 python 中实现的？转换后算法的相同步骤是否成立？

score 4 · Accepted Answer

对数极坐标变换实际上是旋转和尺度不变的。在对数极坐标变换中，旋转对应于 y 轴的偏移，缩放对应于 x 轴的偏移

因此，在图像 y 中找到图像 x 的简单步骤如下：

在图像 y 中查找图像 x（使用笛卡尔坐标中的相位相关）
计算 x 和 y 的对数极坐标变换（这是另一个问题，请参阅下面的参考资料），确保在两个图像中都以相同的特征为中心。
求 x 和 y 的 FFT，比如 F(X) 和 F(y)
求 F(x) 和 F(y) 的相位相关性，称其为 R
求 R 的 IFFT（逆 FFT）。R 的峰值对应于 Y 轴上的旋转偏差和 X 轴上与原始图像的缩放偏差。

参考：

http://etd.lsu.edu/docs/available/etd-07072005-113808/unrestricted/Thunuguntla_thesis.pdf

score 3 · Accepted Answer

我一直在研究同样的问题一段时间。我花了一个周末来写这篇文章。这不是最干净的代码，但我只是物理学家，不是程序员......

相位相关本身很简单：使用您喜欢的卷积算法对两个图像进行卷积。峰值位置为您提供旋转/缩放差异。维基百科（在问题中提到的链接中）对此进行了很好的解释。

我的问题是我找不到一个好的对数极坐标转换器，所以我写了一个。这不是万无一失的，但它可以完成工作。任何愿意重写它以使其更清晰的人，请这样做！

import scipy as sp
from scipy import ndimage
from math import *

def logpolar(input,silent=False):
    # This takes a numpy array and returns it in Log-Polar coordinates.

    if not silent: print("Creating log-polar coordinates...")
    # Create a cartesian array which will be used to compute log-polar coordinates.
    coordinates = sp.mgrid[0:max(input.shape)*2,0:360]
    # Compute a normalized logarithmic gradient
    log_r = 10**(coordinates[0,:]/(input.shape[0]*2.)*log10(input.shape[1]))
    # Create a linear gradient going from 0 to 2*Pi
    angle = 2.*pi*(coordinates[1,:]/360.)

    # Using scipy's map_coordinates(), we map the input array on the log-polar 
    # coordinate. Do not forget to center the coordinates!
    if not silent: print("Interpolation...")
    lpinput = ndimage.interpolation.map_coordinates(input,
                                            (log_r*sp.cos(angle)+input.shape[0]/2.,
                                             log_r*sp.sin(angle)+input.shape[1]/2.),
                                            order=3,mode='constant')

    # Returning log-normal...
    return lpinput

警告：此代码专为灰度图像设计。map_coordinates()通过在每个单独的彩色框架上循环线，它可以很容易地成为处理彩色图像的适配器。

编辑：现在，进行关联的代码很简单。在您的脚本将两个图像都导入为image和target后，请执行以下操作：

# Conversion to log-polar coordinates
lpimage = logpolar(image)
lptarget = logpolar(target)

# Correlation through FFTs    
Fcorr = np.fft.fft2(lpimage)*np.conj(np.fft.fft2(lptarget))
correlation = np.fft.ifft2(Fcorr)

该阵列correlation应包含一个峰值，其坐标是尺寸差和角度差。此外，您可以简单地使用 numpy 的np.correlate()函数，而不是使用 FFT：

# Conversion to log-polar coordinates
lpimage = logpolar(image)
lptarget = logpolar(target)

# Correlation
correlation = np.correlate(lpimage,lptarget)

score 1 · Accepted Answer

这是一个实现：http ://www.lfd.uci.edu/~gohlke/code/imreg.py.html 。我发现找到两个 128x128 图像之间的相似性需要 0.035 秒。

python - 相位相关

3 回答 3

Related

Reference