python 相当于 R 的 NA 是什么?
更具体地说:R 有 NaN、NA、NULL、Inf 和 -Inf。NA 通常在缺少数据时使用。python的等价物是什么?
numpy 和 pandas 等库如何处理缺失值?
scikit-learn 如何处理缺失值?
python 2.7和python 3有什么不同吗?
python 相当于 R 的 NA 是什么?
更具体地说:R 有 NaN、NA、NULL、Inf 和 -Inf。NA 通常在缺少数据时使用。python的等价物是什么?
numpy 和 pandas 等库如何处理缺失值?
scikit-learn 如何处理缺失值?
python 2.7和python 3有什么不同吗?
nan
在 numpy 中可以很好地处理许多功能:
>>> import numpy as np
>>> a = [1, np.nan, 2, 3]
>>> np.nanmean(a)
2.0
>>> np.nansum(a)
6.0
>>> np.isnan(a)
array([False, True, False, False], dtype=bool)
Scikit-learn 目前不处理缺失值。对于大多数机器学习算法,尚不清楚如何处理缺失值,因此我们依赖于用户在将它们提供给算法之前对其进行处理。Numpy 没有“缺失”值。Pandas 使用 NaN,但在数值算法中可能会导致混淆。可以使用掩码数组,但我们在 scikit-learn 中还没有这样做。
pandas
看看这个。
http://pandas.pydata.org/pandas-docs/dev/missing_data.html
熊猫使用NaN
. isnull()
您可以使用or测试空值not null()
,使用 etc 从数据框中删除它们。对象dropna()
的等价datetime
物是NaT