1

我想将 Python 中的三次样条拟合到嘈杂的 x、y 数据并提取每个间隔的样条系数(即我希望为每个间隔获得四个样条系数)

到目前为止,我已经尝试过(全部来自 scipy.interpolate):

1)CubicSpline,但是这种方法不允许我平滑样条,导致不切实际的、跳跃的系数数据。

2) 结合 splrep 和 splev,例如

tck = splrep(x, y, k=3, s=1e25)

我在哪里提取系数/结使用

F = PPoly.from_spline(tck)
coeffs = F.c
knots = F.x

但是,即使我将平滑参数 s 提高到非常大的数字,最终导致结太少,我也无法在整个 x 范围内找到平滑系数(在接近零和 1e23 的值之间跳跃,这是非物理的)结的数量随着 s 减少。似乎我无法同时找到合适的参数 s 和节数。

3) 我使用了 UnivariateSpline(x, y, k=3, s=0.03) 在这里,我发现对改变 s 有更好的敏感性,但是对应的 get_coeffs() 方法并没有为每个区间提供 4 个系数而是只有一个,我不明白。

4)我还尝试了使用三阶多项式的分段脊线回归,但是这种方法为拟合提供了太大的百分比误差,因此让标准样条方法之一工作会很棒。

我错过了什么?有人可以帮忙吗?

4

1 回答 1

3

我在这里看到的具体问题是它UnivariateSpline不会在插值样条中产生 x 的各种幂的代数系数。这是因为它保留在私有_data属性中的系数,它也用get_coeffs方法返回,是一种B 样条系数。这些系数描述了没有任何冗余的样条曲线(对于具有 N 个自由度的样条曲线,您需要其中的 N 个),但是它们所附加的基本样条曲线有些复杂。

但是你可以通过使用derivatives样条对象的方法得到你想要的系数类型。它返回给定点 x 的所有四个导数,从中很容易找到该点的泰勒系数。很自然地使用这种方法,其中 x 是插值的节点,不包括最右边的节点;获得的系数从那个结到下一个结都是有效的。这是一个示例,带有“花式”格式的输出。

import numpy as np
from scipy.interpolate import UnivariateSpline
spl = UnivariateSpline(np.arange(6), np.array([3, 1, 4, 1, 5, 9]), s=0)
kn = spl.get_knots()
for i in range(len(kn)-1):
    cf = [1, 1, 1/2, 1/6] * spl.derivatives(kn[i])
    print("For {0} <= x <= {1}, p(x) = {5}*(x-{0})^3 + {4}*(x-{0})^2 + {3}*(x-{0}) + {2}".format(kn[i], kn[i+1], *cf))

在此示例中,结为 0、2、3、5。输出是:

For 0.0 <= x <= 2.0, p(x) = -3.1222222222222222*(x-0.0)^3 + 11.866666666666667*(x-0.0)^2 + -10.744444444444445*(x-0.0) + 3.000000000000001
For 2.0 <= x <= 3.0, p(x) = 4.611111111111111*(x-2.0)^3 + -6.866666666666667*(x-2.0)^2 + -0.7444444444444436*(x-2.0) + 4.000000000000001
For 3.0 <= x <= 5.0, p(x) = -2.322222222222221*(x-3.0)^3 + 6.966666666666665*(x-3.0)^2 + -0.6444444444444457*(x-3.0) + 1.0000000000000016

请注意,对于每个部分,cf保留从最低度数开始的系数,因此在格式化字符串时顺序是相反的。

(当然,您可能想对这些系数做些别的事情)

为了检查公式是否正确,我将它们复制粘贴以进行绘图:

样条

于 2017-05-05T22:38:37.833 回答