4

4我目前正在尝试将大量数据拟合到正弦函数中。在我只有一组数据(一维数组)的情况下,scipy.optimize.curve_fit()工作正常。但是,据我所知,如果函数本身只是一维的,则它不允许更高维的数据输入。我不想使用 for 循环遍历数组,因为这在 python 中运行速度非常慢。

到目前为止,我的代码应该类似于:

from scipy import optimize
import numpy as np    
def f(x,p1,p2,p3,p4): return p1 + p2*np.sin(2*np.pi*p3*x + p4)      #fit function

def fit(data,guess):
   n = data.shape[0] 
   leng = np.arange(n)
   param, pcov = optimize.curve_fit(f,leng,data,guess)
   return param, pcov

其中 data 是一个三维数组 ( shape=(x,y,z)),我想将每一行拟合data[:,a,b]到函数中,并将param(4,y,z)作为输出。当然,对于多维数据,这会导致

ValueError: operands could not be broadcast together with shapes (2100,2100) (5)

也许有一个简单的解决方案,但我不知道该怎么做。有什么建议么?

搜索我的问题的答案非常困难,因为大多数带有这些关键字的主题都与高维函数的拟合有关。

4

1 回答 1

4

使用np.apply_along_axis()可以解决您的问题。只需这样做:

func1d = lambda y, *args: optimize.curve_fit(f, xdata=x, ydata=y, *args)[0] #<-- [0] to get only popt
param = np.apply_along_axis( func1d, axis=2, arr=data )

请参见下面的示例:

from scipy import optimize
import numpy as np
def f(x,p1,p2,p3,p4):
    return p1 + p2*np.sin(2*np.pi*p3*x + p4)
sx = 50  # size x
sy = 200 # size y
sz = 100 # size z
# creating the reference parameters
tmp = np.empty((4,sy,sz))
tmp[0,:,:] = (1.2-0.8) * np.random.random_sample((sy,sz)) + 0.8
tmp[1,:,:] = (1.2-0.8) * np.random.random_sample((sy,sz)) + 0.8
tmp[2,:,:] = np.ones((sy,sz))
tmp[3,:,:] = np.ones((sy,sz))*np.pi/4
param_ref = np.empty((4,sy,sz,sx))     # param_ref in this shape will allow an
for i in range(sx):                    # one-shot evaluation of f() to create 
    param_ref[:,:,:,i] = tmp           # the data sample
# creating the data sample
x = np.linspace(0,2*np.pi)
factor = (1.1-0.9)*np.random.random_sample((sy,sz,sx))+0.9
data = f(x, *param_ref) * factor       # the one-shot evalution is here
# finding the adjusted parameters
func1d = lambda y, *args: optimize.curve_fit(f, xdata=x, ydata=y, *args)[0] #<-- [0] to get only popt
param = np.apply_along_axis( func1d, axis=2, arr=data )
于 2013-05-01T08:55:17.910 回答