现在我有一个新数据集,前 2 列是 X 和 Y 点(通常它们代表位置。数据文件非常大,对于初始数据分析,我需要提取特定行(或接近行数据) - 是有什么方法可以告诉numpy(或python,或pandas)提取这个特定的数据集 - 附件是一个例子,它被简化并且数据非常圆润(实际数据并非如此)但会清楚地显示什么我需要:
示例 编辑*
import os
import sys
import numpy as np
X = list(range(45))*3
Y = list(range(1, 91, 2)) + list(range(20, 65, 1)) + list(range(1, 136, 3))
XY = zip(X, Y)
XYarray = np.array(XY).reshape(135, 2)
import matplotlib.pyplot as plt
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
plt.plot(XYarray[:,0], XYarray[:,1], 'ro') #all data
plt.plot(XYarray[0:44,0], XYarray[0:44,1], 'b*') #first line to be teste
#plt.plot(XYarray[45:90,0], XYarray[45:90,1], 'g*') #other lines of interest
#plt.plot(XYarray[91:135,0], XYarray[91:135,1], 'gx') #otherline of ineters
fig.show()
我所有的数据都位于任意 XY 数组(表面空间数据)中 - 我需要提取可用的线;例如,我只想提取未注释的蓝星线 - 然后移动下一条(当前在代码中注释请记住,我的实际数据不是那么常规希望有帮助