30

python 相当于 R 的 NA 是什么?

更具体地说:R 有 NaN、NA、NULL、Inf 和 -Inf。NA 通常在缺少数据时使用。python的等价物是什么?

numpy 和 pandas 等库如何处理缺失值?

scikit-learn 如何处理缺失值?

python 2.7和python 3有什么不同吗?

4

3 回答 3

18

nan在 numpy 中可以很好地处理许多功能:

>>> import numpy as np
>>> a = [1, np.nan, 2, 3]
>>> np.nanmean(a)
2.0
>>> np.nansum(a)
6.0
>>> np.isnan(a)
array([False,  True, False, False], dtype=bool)
于 2015-02-22T06:03:23.180 回答
8

Scikit-learn 目前不处理缺失值。对于大多数机器学习算法,尚不清楚如何处理缺失值,因此我们依赖于用户在将它们提供给算法之前对其进行处理。Numpy 没有“缺失”值。Pandas 使用 NaN,但在数值算法中可能会导致混淆。可以使用掩码数组,但我们在 scikit-learn 中还没有这样做。

于 2015-02-23T01:33:51.670 回答
6

pandas看看这个。

http://pandas.pydata.org/pandas-docs/dev/missing_data.html

熊猫使用NaN. isnull()您可以使用or测试空值not null(),使用 etc 从数据框中删除它们。对象dropna()的等价datetime物是NaT

于 2015-02-22T03:58:43.907 回答