5

我有两个数据集要相互关联。它们看起来与arctan函数相似,因此我一直将其用作模型来研究如何进行信号处理。

x = linspace(-15, 15, 2**13)
f1 = arctan(x)
f2 = arctan(x + 2)

在此处输入图像描述

我需要回答的问题是,我需要将绿色信号移动多少才能使其(大部分)与蓝色信号重叠?f1我认为这就像在和的互相关函数中找到最大值一样简单f2,我在这里广泛遵循了建议:如何将两个时间序列与间隙和不同的时间基准相关联?. 这是我一直在尝试的

c = correlate(f1, f2, 'full')
s = arange(1-2**13, 2**13)
dx = 30/2**13
shift = s[c.argmax()]*dx

我希望shift或多或少正好等于 2,但实际上它只是0.234. 这对我来说没有任何意义;我找到了互相关最大值的 x 坐标,应该在两个信号最大重叠的地方找到。

关于如何为这种函数计算这个数量的任何想法?

编辑:我应该添加,对于我的真实数据,所有的值都将在零和一之间

编辑编辑:以下函数实际上更像我的真实数据:

x = linspace(-15, 15, 400)
f1 = (arctan(-x) + pi/2) / pi
f2 = (arctan(-x + 2) + pi/2) / pi

在此处输入图像描述

因此,使用此处给出的公式:http: //paulbourke.net/miscellaneous/correlate/我可以编写一个互相关函数来填充数据以在左侧添加 1 并在右侧添加零:

def xcorr(x, y);
    mx = x.mean()
    my = y.mean()
    sx = x.std()
    sy = y.std()
    r = zeros(2*len(x))

    for d in range(-len(x), len(x)):
        csum = 0
        for i in range(0, len(x):
            yindx = i - d
            if i - d < 0:
                yval = 1
            elif i - d >= len(x):
                yval = 0
            else:
                yval = y[yindx]
            csum += (x[i] - mx) * (yval - my)
        r[d + len(x)] = csum / (sx * sy)
    return r

有了这个功能,我现在可以做

c = xcorr(f1, f2)
s = arange(-400, 400)
dx = 30/400
shift = s[c.argmax()] * dx

结果是 2.025,以这种精度可以接近 2。所以看起来 Jamie 是正确的,问题在于 numpy 如何correlate填充信号。

所以,显然我的xcorr功能真的很慢。现在的问题是,有没有办法让 NumPy 做类似的事情,或者我应该继续使用 C 语言编写我的算法ctypes

4

2 回答 2

3

正如人们所指出的,互相关被数据之外的填充所混淆。

尽管感觉就像您丢弃了好的数据,但通常最好只修剪数据集,以便可以在没有假设的情况下完成相关性(至少与将实际数据与填充数据相关联的替代方法相比) .

x = linspace(-15, 15, 4000)
f1 = (arctan(-x) + pi/2) / pi
f2 = (arctan(-x + 2) + pi/2) / pi

L4 = int(len(f2)/8)
sf2 = f2[L4:-L4]

c = correlate(f1-mean(f1), sf2-mean(f1), 'same')
print "peak correlation occurs at:", x[argmax(c)]  # -2.02925731433

plt.plot(x, c)
plt.show()

在此处输入图像描述

另外,虽然,我不确定 xcorr 是这里最好的方法。如何将不同班次的 y 轴值之间的距离相加并取最小值,这样就可以避免零在哪里等所有问题。

于 2013-04-14T04:52:50.507 回答
1

互相关的最大值发现的是两个信号的乘积之和为最大值的偏移。有人会认为两个信号的互相关,一个是另一个信号的时间偏移,在偏移时会最大。虽然这对于无限信号来说是正确的,但 numpy 对两个信号进行零填充,所以对于两个同样长的信号,你只有一个2**13非零值的总和,用于零偏移,而更高的值来自更好的匹配两个函数是偏移的,但非零值较少。

如果您的信号在 +/- 无穷大时为 0,这不会太糟糕。事实上,我无法使用互相关提出任何合理的解决方案。

于 2013-04-13T16:47:33.167 回答