2

我有许多短时间序列(可能是 30 - 100 个时间点),它们有一个大致的形状:它们从高位开始,迅速下降,可能会或可能不会在零附近稳定,然后回升。如果它们不平稳,它们看起来就像一个简单的二次曲线,如果它们确实平稳,你可能会有一长串零。

我正在尝试使用该lmfit模块来拟合连续的分段线性曲线。我想推断线在哪里改变梯度,也就是说,我想知道曲线在哪里“定性地”改变梯度。我想知道梯度什么时候停止下降,什么时候又开始增加,一般来说。我有一些问题:

  • lmfit似乎至少需要两个参数,所以我必须通过_.
  • 我不确定如何将一个参数限制为大于另一个参数。
  • 我收到could not broadcast input array from shape (something) into shape (something) 错误

这是一些代码。首先,我的目标函数,要最小化。

def piecewiselinear(params, data, _) :

    t1 = params["t1"].value
    t2 = params["t2"].value
    m1 = params["m1"].value
    m2 = params["m2"].value
    m3 = params["m3"].value
    c = params["c"].value

    # Construct continuous, piecewise-linear fit
    model = np.zeros_like(data)
    model[:t1] = c + m1 * np.arange(t1)
    model[t1:t2] = model[t1-1] + m2 * np.arange(t2 - t1)
    model[t2:] = model[t2-1] + m3 * np.arange(len(data) - t2)

    return model - data

然后我打电话,

p = lmfit.Parameters()
p.add("t1", value = len(data)/4, min = 1, max = len(data))
p.add("t2", value = len(data)/4*3, min = 2, max = len(data))
p.add("m1", value = -100., max=0)
p.add("m2", value = 0.)
p.add("m3", value = 20., min = 1.)
p.add("c", min=0, value = 800.)

result = lmfit.minimize(piecewiselinear, p, args = (data, _) )

该模型是,在某个时间 t1,线的梯度发生变化,并且同样发生在 t2。需要推断这两个参数以及线段的梯度(和一个截距)。

我可以使用 MCMC 方法做到这一点,但我有太多这些系列,而且需要太长时间。

部分回溯:

     15     model = np.zeros_like(data)
     16     model[:t1] = c + m1 * np.arange(t1)
---> 17     model[t1:t2] = model[t1-1] + m2 * np.arange(t2-t1)
     18     model[t2:] = model[t2-1] + m3 * np.arange(len(data) - t2)
     19 

ValueError: could not broadcast input array from shape (151) into shape (28)

时间序列的几个例子: 没有高原:稳定下降和上升 长而陡峭的高原

欢迎任何和所有建议。非常感谢。

4

2 回答 2

1

这是一个相当蛮力的 3-pwlin 钳工的情节;将用粗略的代码换取测试用例。 在此处输入图像描述

另外,几个链接:
Fit-piecewise-linear-data on dsp.stack 可能会给你一些想法;添加了一些关于 动态编程的内容。
github.com/NickFoubert/simple-segment 有 python 用于分割例如具有 max_error(不是件数)的 ECG,来自 Keogh 等人的一篇不错的论文, 用于分割时间序列的在线算法,2001,8p。

还有一个可能的选择:你能把力量放进去吗, (p在 转移到 [-1 .. 1] 和> 1e-6 左右之后)? 这将是健壮快速且易于绘制和理解的。 人们可能应该对两端进行加权,以使误差大致平坦且正常。 也可以单独安装到左右两半。y ~ x^plog y ~ p log x^2xy


p p'

于 2014-02-28T10:34:43.157 回答
0

走蛮力路线似乎可以解决问题。我只是在测试开关点的所有组合并选择最合适的。它非常快并且可以相当健壮。这是一个特别适合的结果。

在此处输入图像描述

我强制第二行的梯度为零。这确保了我们不会得到两条线的良好拟合和一条完美的拟合,这可能会获得更高的分数(我在这里使用 R^2 值的总和)。绿色标记了开关点,这些对我的应用程序来说应该很好用。

我很想学一个更优雅的方法来做这件事,但与此同时,这是一个选择......

于 2014-03-04T16:43:03.360 回答