python - 使用 Numpy 获取矩阵中数组的平均值

Question

columnFour = [data[0::, 1] == 1, data[0::, 4]]

数据是一个表格，其中 1 是我要选择的变量（它等于 1），而 4 是我试图绘制到一维数组中的变量。

4列中的一些值是空白（''），我从python得到的错误如下：

Traceback (most recent call last):
File "<filename>", line 62, in <module>
  print np.mean(age, dtype=float);
File "D:\Python27\lib\site-packages\numpy\core\fromnumeric.py", line 2373, in mean
  return _wrapit(a, 'mean', axis, dtype, out)
File "D:\Python27\lib\site-packages\numpy\core\fromnumeric.py", line 37, in _wrapit
  result = getattr(asarray(obj),method)(*args, **kwds)
File "D:\Python27\lib\site-packages\numpy\core\numeric.py", line 235, in asarray
  return array(a, dtype, copy=False, order=order)
ValueError: cannot set an array element with a sequence

如何选择第 4 列中的所有非空数字，或选择包括那些空值在内的所有数字？我宁愿全选，但任何一个都可以。我试图得出第 4 列中数据的平均值以重新插入空值，但在不同的第 1 列值中对它们进行平均。

例如，第 4 列中的所有数字column 1 == 1将被平均，然后column 1 == 1将重新插入该平均值的空值。

编辑：我使用 for 循环来浏览数据。

对于数据中的 x：如果 x[1] == '1' 和 x[4]：first.append(np.float(x[4]))
如果 x[1] == '2' 和 x[4] : second.append(np.float(x[4])) 如果 x[1] == '3' 和 x[4]:third.append(np.float(x[4]))

结果是三个数组具有我正在寻找的不同值，然后可以对其进行平均并放回数据中的孔中。

score 0 · Accepted Answer

我想你想要这样的东西：

mask = data[:, 1] == 1
average = np.mean(data[mask, 4])

您提供的代码中没有列表理解，您只需创建一个包含两个元素的列表，第一个data[:, 1] == 1和第二个data[:, 4]。

python - 使用 Numpy 获取矩阵中数组的平均值

1 回答 1

Related

Reference