我在 Stack Overflow 上找不到已经回答了我的问题的问题,所以很抱歉,如果已经有人问过这个问题而我只是找不到它。
总而言之,这个问题更多是关于根据我使用的代码了解我的数据会发生什么。
所以,我有一个数据集,里面有几个 NA。
我想汇总数据并使用na.rm=True
它告诉 R 在计算时忽略 NA,对吗?我收到的输出包括 NA,这导致我将函数na.action=na.pass
与na.rm=True
. 这使我的输出中的 NA 明显减少。老实说,我不明白为什么...
由于我喜欢自己尝试并找出答案,因此我查看了聚合函数的不同变体:
- 只有
na.rm=True
- 只有
na.action=na.pass
na.rm=True
,na.action=na.pass
只使用 2。我得到了很多 NA,这是有道理的,因为我告诉 R 将所有 NA 包括在计算中而不包含na.rm=True
在其中。同时 1. 和 3. 不要给我相同的结果。这是为什么?
我认为这两者的na.rm=True
意思na.action=na.pass
是一样的......显然他们没有,因为我的变量的平均值略有不同。
当我同时使用 na.rm=True 和na.action=na.pass
聚合函数时,与仅使用na.rm=True
. 哪个更好用?
非常感谢,感谢您的帮助!