我有一个大小数组:(50, 50)。在这个数组中有一个大小为 (20,10) 的切片。只有这个 slice 包含数据,其余部分都设置为 nan。
如何从我的大阵列中切出这个切片?
我有一个大小数组:(50, 50)。在这个数组中有一个大小为 (20,10) 的切片。只有这个 slice 包含数据,其余部分都设置为 nan。
如何从我的大阵列中切出这个切片?
您可以使用精美的索引来收集以下项目not NaN
:
a = a[ np.logical_not( np.isnan(a) ) ].reshape(20,10)
或者,正如乔金顿所建议的那样:
a = a[ ~np.isnan(a) ]
你知道NaN在哪里吗?如果是这样,这样的事情应该可以工作:
newarray = np.copy(oldarray[xstart:xend,ystart:yend])
其中xstart
和xend
是您想要在 x 维度中的切片的开头和结尾,对于 y 也是如此。然后,如果您不再需要它,您可以删除旧数组以释放内存。
如果您不知道 NaN 在哪里,这应该可以解决问题:
# in this example, the starting array is A, numpy is imported as np
boolA = np.isnan(A) #get a boolean array of where the nans are
nonnanidxs = zip(*np.where(boolA == False)) #all the indices which are non NaN
#slice out the nans
corner1 = nonnanidxs[0]
corner2 = nonnanidxs[-1]
xdist = corner2[0] - corner1[0] + 1
ydist = corner2[1] - corner1[1] + 1
B = copy(A[corner1[0]:corner1[0]+xdist,corner1[1]:corner1[1]+ydist])
#B is now the array you want
请注意,这对于大型数组来说会很慢,因为要np.where
查看整个内容。在数字错误跟踪器中存在一个未解决的问题,即找到第一个索引等于某个值然后停止的方法。可能有一种更优雅的方式来做到这一点,这只是我想到的第一件事。
编辑:忽略,sgpc 的答案要好得多。