1

我有一个数据框,并复制了它。在副本中,我将所有 NA 替换为 -99999,而原件保持不变。当我对它们都使用相同的 describe() 函数时,我得到了非常不同的结果。我会很高兴有人可以解释在这个编码的后台发生了什么。此外,当我绘制图表时,-99999 没有出现,这让我觉得一开始就没有 NA。我很困惑。

这是代码:

df1 = df.copy()

df1['price'].fillna(-99999, inplace = True)    # replace NA data with -99999

df['price'].describe()

df1['price'].describe()

各自的结果是:

df['price'].describe()

Out[126]: 

count     16869745.0

unique        7305.0

top             40.0

freq         26098.0

Name: price, dtype: float64

和:

df1['price'].describe()

Out[127]: 

count    1.686974e+07

mean     3.191416e+01

std      1.165290e+01

min      1.000000e+00

25%      1.999000e+01

50%      3.529000e+01

75%      4.077000e+01

max      5.411000e+01

Name: price, dtype: float64
4

0 回答 0