10

我有一组代表数字输出的 CSV 值。它是使用模拟示波器收集的,因此它不是完美的数字信号。我试图过滤掉数据以获得完美的数字信号来计算周期(可能会有所不同)。我还想定义我从这个过滤中得到的最大误差。

像这样的东西:

在此处输入图像描述

主意

应用数据的阈值。这是一个伪代码:

for data_point_raw in data_array:
    if data_point_raw < 0.8: data_point_perfect = LOW
    if data_point_raw > 2  : data_point_perfect = HIGH

else:
    #area between thresholds
    if previous_data_point_perfect == Low : data_point_perfect = LOW
    if previous_data_point_perfect == HIGH: data_point_perfect = HIGH

有两个问题困扰着我。

  1. 这似乎是数字信号处理中的一个常见问题,但是我还没有找到它的预定义标准函数。这是执行过滤的好方法吗?
  2. 我将如何获得最大错误?
4

4 回答 4

7

这里有一些代码可能会有所帮助。

from __future__ import division

import numpy as np


def find_transition_times(t, y, threshold):
    """
    Given the input signal `y` with samples at times `t`,
    find the times where `y` increases through the value `threshold`.

    `t` and `y` must be 1-D numpy arrays.

    Linear interpolation is used to estimate the time `t` between
    samples at which the transitions occur.
    """
    # Find where y crosses the threshold (increasing).
    lower = y < threshold
    higher = y >= threshold
    transition_indices = np.where(lower[:-1] & higher[1:])[0]

    # Linearly interpolate the time values where the transition occurs.
    t0 = t[transition_indices]
    t1 = t[transition_indices + 1]
    y0 = y[transition_indices]
    y1 = y[transition_indices + 1]
    slope = (y1 - y0) / (t1 - t0)
    transition_times = t0 + (threshold - y0) / slope

    return transition_times


def periods(t, y, threshold):
    """
    Given the input signal `y` with samples at times `t`,
    find the time periods between the times at which the
    signal `y` increases through the value `threshold`.

    `t` and `y` must be 1-D numpy arrays.
    """
    transition_times = find_transition_times(t, y, threshold)
    deltas = np.diff(transition_times)
    return deltas


if __name__ == "__main__":
    import matplotlib.pyplot as plt

    # Time samples
    t = np.linspace(0, 50, 501)
    # Use a noisy time to generate a noisy y.
    tn = t + 0.05 * np.random.rand(t.size)
    y = 0.6 * ( 1 + np.sin(tn) + (1./3) * np.sin(3*tn) + (1./5) * np.sin(5*tn) +
               (1./7) * np.sin(7*tn) + (1./9) * np.sin(9*tn))

    threshold = 0.5
    deltas = periods(t, y, threshold)
    print("Measured periods at threshold %g:" % threshold)
    print(deltas)
    print("Min:  %.5g" % deltas.min())
    print("Max:  %.5g" % deltas.max())
    print("Mean: %.5g" % deltas.mean())
    print("Std dev: %.5g" % deltas.std())

    trans_times = find_transition_times(t, y, threshold)

    plt.plot(t, y)
    plt.plot(trans_times, threshold * np.ones_like(trans_times), 'ro-')
    plt.show()

输出:

Measured periods at threshold 0.5:
[ 6.29283207  6.29118893  6.27425846  6.29580066  6.28310224  6.30335003]
Min:  6.2743
Max:  6.3034
Mean: 6.2901
Std dev: 0.0092793

阴谋

您可以使用numpy.histogram和/或matplotlib.pyplot.hist进一步分析periods(t, y, threshold).

于 2013-02-27T14:46:44.897 回答
2

这不是您问题的答案,只是可能有帮助的建议。我在这里写它是因为我无法将图像放在评论中。

我认为您应该在进行任何处理之前以某种方式规范化数据。

标准化到 0...1 的范围后,您应该应用您的过滤器。

在此处输入图像描述

于 2013-02-27T14:36:47.293 回答
1

如果你真的只对周期感兴趣,你可以绘制傅里叶变换,你会在信号频率出现的地方有一个峰值(所以你有周期)。傅里叶域中的峰值越宽,周期测量的误差就越大

import numpy as np

data = np.asarray(my_data)

np.fft.fft(data)
于 2013-02-27T13:17:41.450 回答
1

您的过滤很好,它与施密特触发器基本相同,但您可能遇到的主要问题是速度。使用 Numpy 的好处是它可以和 C 一样快,而您必须在每个元素上迭代一次。

您可以使用 SciPy 的中值滤波器实现类似的效果。以下应该达到类似的结果(并且不依赖于任何幅度):

filtered = scipy.signal.medfilt(raw)
filtered = numpy.where(filtered > numpy.mean(filtered), 1, 0)

您可以使用 调整中值过滤的强度medfilt(raw, n_samples)n_samples默认为 3。

至于错误,那将是非常主观的。一种方法是在不过滤的情况下对信号进行离散化,然后比较差异。例如:

discrete = numpy.where(raw > numpy.mean(raw), 1, 0)
errors = np.count_nonzero(filtered != discrete)
error_rate = errors / len(discrete)
于 2013-02-27T14:23:21.343 回答