2

下面是基于线性方程使用 Scipy 中的 Curve_Fit 的示例。我对曲线拟合的一般理解是,它需要一个随机点图并创建一条曲线来显示一系列数据点的“最佳拟合”。我的问题是使用scipy curve_fit它返回:

“参数的最佳值,以使 f(xdata, *popt) - ydata 的平方误差之和最小化”。

这两个值在简单的英语中究竟是什么意思?谢谢!

import numpy as np
from scipy.optimize import curve_fit
# Creating a function to model and create data
def func(x, a, b):
    return a * x + b
# Generating clean data
x = np.linspace(0, 10, 100)
y = func(x, 1, 2)
# Adding noise to the data
yn = y + 0.9 * np.random.normal(size=len(x))
# Executing curve_fit on noisy data
popt, pcov = curve_fit(func, x, yn)
# popt returns the best fit values for parameters of
# the given model (func).
print(popt)
4

1 回答 1

4

您要求 SciPy 通过一组点对 (x, y) 告诉您“最佳”线。

这是一条直线的方程:

y = a*x + b

线的斜率为a; y 截距为b

你有两个参数ab,所以你只需要两个方程来求解两个未知数。两点定义一条线,对吧?

那么当你有两个以上的点时会发生什么?你不能通过所有的点。你如何选择斜率和截距给你“最好的”线?

定义“最佳”的一种方法是计算斜率和截距,以使每个 y 值与线上该 x 处的预测 y 之间的差的平方最小:

error = sum[(y(i) - (a*x(i) + b))^2]

如果您知道微积分,这是一个简单的练习:获取 error wrt 的一阶导数a并将b它们设置为零。您将有两个具有两个未知数的方程,a并且b。您解决它们以获得“最佳”线的系数。

于 2013-10-24T20:50:24.100 回答