columnFour = [data[0::, 1] == 1, data[0::, 4]]
数据是一个表格,其中 1 是我要选择的变量(它等于 1),而 4 是我试图绘制到一维数组中的变量。
4列中的一些值是空白(''),我从python得到的错误如下:
Traceback (most recent call last):
File "<filename>", line 62, in <module>
print np.mean(age, dtype=float);
File "D:\Python27\lib\site-packages\numpy\core\fromnumeric.py", line 2373, in mean
return _wrapit(a, 'mean', axis, dtype, out)
File "D:\Python27\lib\site-packages\numpy\core\fromnumeric.py", line 37, in _wrapit
result = getattr(asarray(obj),method)(*args, **kwds)
File "D:\Python27\lib\site-packages\numpy\core\numeric.py", line 235, in asarray
return array(a, dtype, copy=False, order=order)
ValueError: cannot set an array element with a sequence
如何选择第 4 列中的所有非空数字,或选择包括那些空值在内的所有数字?我宁愿全选,但任何一个都可以。我试图得出第 4 列中数据的平均值以重新插入空值,但在不同的第 1 列值中对它们进行平均。
例如,第 4 列中的所有数字column 1 == 1
将被平均,然后column 1 == 1
将重新插入该平均值的空值。
编辑:我使用 for 循环来浏览数据。
对于数据中的 x:如果 x[1] == '1' 和 x[4]:first.append(np.float(x[4]))
如果 x[1] == '2' 和 x[4] : second.append(np.float(x[4])) 如果 x[1] == '3' 和 x[4]:third.append(np.float(x[4]))
结果是三个数组具有我正在寻找的不同值,然后可以对其进行平均并放回数据中的孔中。