scipy - 不同的python函数来拟合三次样条，找到系数

Question

我想将 Python 中的三次样条拟合到嘈杂的 x、y 数据并提取每个间隔的样条系数（即我希望为每个间隔获得四个样条系数）

到目前为止，我已经尝试过（全部来自 scipy.interpolate）：

1）CubicSpline，但是这种方法不允许我平滑样条，导致不切实际的、跳跃的系数数据。

2) 结合 splrep 和 splev，例如

tck = splrep(x, y, k=3, s=1e25)

我在哪里提取系数/结使用

F = PPoly.from_spline(tck)
coeffs = F.c
knots = F.x

但是，即使我将平滑参数 s 提高到非常大的数字，最终导致结太少，我也无法在整个 x 范围内找到平滑系数（在接近零和 1e23 的值之间跳跃，这是非物理的）结的数量随着 s 减少。似乎我无法同时找到合适的参数 s 和节数。

3) 我使用了 UnivariateSpline(x, y, k=3, s=0.03) 在这里，我发现对改变 s 有更好的敏感性，但是对应的 get_coeffs() 方法并没有为每个区间提供 4 个系数而是只有一个，我不明白。

4）我还尝试了使用三阶多项式的分段脊线回归，但是这种方法为拟合提供了太大的百分比误差，因此让标准样条方法之一工作会很棒。

我错过了什么？有人可以帮忙吗？

score 3 · Accepted Answer

我在这里看到的具体问题是它UnivariateSpline不会在插值样条中产生 x 的各种幂的代数系数。这是因为它保留在私有_data属性中的系数，它也用get_coeffs方法返回，是一种B 样条系数。这些系数描述了没有任何冗余的样条曲线（对于具有 N 个自由度的样条曲线，您需要其中的 N 个），但是它们所附加的基本样条曲线有些复杂。

但是你可以通过使用derivatives样条对象的方法得到你想要的系数类型。它返回给定点 x 的所有四个导数，从中很容易找到该点的泰勒系数。很自然地使用这种方法，其中 x 是插值的节点，不包括最右边的节点；获得的系数从那个结到下一个结都是有效的。这是一个示例，带有“花式”格式的输出。

import numpy as np
from scipy.interpolate import UnivariateSpline
spl = UnivariateSpline(np.arange(6), np.array([3, 1, 4, 1, 5, 9]), s=0)
kn = spl.get_knots()
for i in range(len(kn)-1):
    cf = [1, 1, 1/2, 1/6] * spl.derivatives(kn[i])
    print("For {0} <= x <= {1}, p(x) = {5}*(x-{0})^3 + {4}*(x-{0})^2 + {3}*(x-{0}) + {2}".format(kn[i], kn[i+1], *cf))

在此示例中，结为 0、2、3、5。输出是：

For 0.0 <= x <= 2.0, p(x) = -3.1222222222222222*(x-0.0)^3 + 11.866666666666667*(x-0.0)^2 + -10.744444444444445*(x-0.0) + 3.000000000000001
For 2.0 <= x <= 3.0, p(x) = 4.611111111111111*(x-2.0)^3 + -6.866666666666667*(x-2.0)^2 + -0.7444444444444436*(x-2.0) + 4.000000000000001
For 3.0 <= x <= 5.0, p(x) = -2.322222222222221*(x-3.0)^3 + 6.966666666666665*(x-3.0)^2 + -0.6444444444444457*(x-3.0) + 1.0000000000000016

请注意，对于每个部分，cf保留从最低度数开始的系数，因此在格式化字符串时顺序是相反的。

（当然，您可能想对这些系数做些别的事情）

为了检查公式是否正确，我将它们复制粘贴以进行绘图：

scipy - 不同的python函数来拟合三次样条，找到系数

1 回答 1

Related

Reference