9

我编写的一个非常简单的代码遇到了一些问题。我有 4 组数据,并且想使用 numpy polyfit 生成多项式最佳拟合线。其中 3 个列表在使用 polyfit 时产生数字,但第三个数据集在使用 polyfit 时产生 NAN。下面是代码和打印出来的。有任何想法吗?

代码:

所有的“ind_#”都是数据列表。下面将它们转换为 numpy 数组,然后可以生成多项式最佳拟合线

ind_1=np.array(ind_1, np.float)

dep_1=np.array(dep_1, np.float)

x_1=np.arange(min(ind_1)-1, max(ind_1)+1, .01)

ind_2=np.array(ind_2, np.float)

dep_2=np.array(dep_2, np.float)

x_2=np.arange(min(ind_2)-1, max(ind_2)+1, .01)

ind_3=np.array(ind_3, np.float)

dep_3=np.array(dep_3, np.float)

x_3=np.arange(min(ind_3)-1, max(ind_3)+1, .01)

ind_4=np.array(ind_4, np.float)

dep_4=np.array(dep_4, np.float)

x_4=np.arange(min(ind_4)-1, max(ind_4)+1, .01)

下面打印出上面生成的数组,以及 polyfit 列表的内容,通常是多项式方程的系数,但对于下面的第三种情况,所有 polyfit 内容都打印为 NAN

print(ind_1)

print(dep_1)

print(np.polyfit(ind_1,dep_1,2))

print(ind_2)

print(dep_2)

print(np.polyfit(ind_2,dep_2,2))

print(ind_3)

print(dep_3)

print(np.polyfit(ind_3,dep_3,2))

print(ind_4)

print(dep_4)

print(np.polyfit(ind_4,dep_4,2))

打印出:

[ 1.405  1.871  2.713 ...,  5.367  5.404  2.155]

[ 0.274  0.07   0.043 ...,  0.607  0.614  0.152]

[ 0.01391925 -0.00950728  0.14803846]

[ 0.9760001  2.067      8.8       ...,  1.301      1.625      2.007    ]

[ 0.219      0.05       0.9810001 ...,  0.163      0.161      0.163    ]

[ 0.00886807 -0.00868727  0.17793324]

[ 1.143      0.9120001  2.162     ...,  2.915      2.865      2.739    ]

[ 0.283  0.3    0.27  ...,  0.227  0.213  0.161]

[ nan  nan  nan]

[ 0.167  0.315  1.938 ...,  2.641  1.799  2.719]

[ 0.6810001  0.7140001  0.309     ...,  0.283      0.313      0.251    ]

[ 0.00382331  0.00222269  0.16940372]

为什么第三种情况的 polyfit 常量被列为 NAN?所有数据集的数据类型相同,所有代码一致。请帮忙。

4

1 回答 1

20

刚看了你的资料。发生这种情况是因为您有一个NaNin dep_3(元素 713)。您可以确保您只在拟合中使用有限值,如下所示:

idx = np.isfinite(ind_3) & np.isfinite(dep_3)
print(np.polyfit(ind_3[idx], dep_3[idx], 2))

至于在大型数据集中查找错误值,numpy 让这变得非常容易。你可以找到这样的索引:

print(np.where(~np.isfinite(dep_3)))
于 2012-12-03T23:27:31.017 回答