我有一个由 10 个变量组成的数据框。一个变量是站 ID。我有 10 个站(A、B、C 和 J),每个站每天观察五年。我总共有 18260 个观察值。我的观察结果包含 NA 很多天。我的数据框看起来像这样
stationID x1 x2 x3 x4 x10
A
A
A
A
B
B
B
B
C
C
C
C
J
J
J
我想根据站名获取每个变量的汇总统计信息(主要是 n、平均值、中位数和 sd)。
我虽然关于
library(psych)
describeBy(mydf, mydf$stationID)
我将所有变量的汇总统计信息作为每个站点的表格。但我想得到这样的东西
station A station B station C station J
var.2 n
mean
sd
median
Var.3 n
mean
sd
median
Var.10 n
mean
sd
median
当变量具有 NA 时,我没有得到汇总统计信息。如何获得汇总统计的输出,如所有变量(包括那些有 NA 的变量)所示?
我相信这个问题与其他建议的问题/答案不同,因为它有多个统计参数,而且我的观察结果包含 NA