r - 如何将 na.rm 作为参数传递给 tapply？

Question

我想从一个数据框中计算平均值和标准差，其中一列用于参数，一列用于组标识符。使用时如何计算它们tapply？我可以使用sd(v1, group, na.rm=TRUE)，但在使用时无法将其na.rm=TRUE放入语句中tapply。 omit.na是没有选择的。我有一大堆参数，并且在排除所有具有一个缺失值的行时，必须逐步完成它们而不会丢失一半的数据帧。

data("weightgain", package = "HSAUR")
tapply(weightgain$weightgain, list(weightgain$source, weightgain$type), mean)

声明也是如此by。

x<-c(1,2,3,4,5,6,7,8,9,NA)
y<-c(2,3,NA,3,4,NA,2,3,NA,2)
group<-rep((factor(LETTERS[1:2])),5)
df<-data.frame(x,y,group)
df

by(df$x,df$group,summary)
by(df$x,df$group,mean)

sd(df$x) #result: NA
sd(df$x, na.rm=TRUE) #result: 2.738613

任何想法如何完成这项工作？

score 26 · Accepted Answer

只需na.rm=TRUE在tapply函数中设置：

tapply(weightgain$weightgain, list(weightgain$source, weightgain$type), mean, na.rm=TRUE)

score 5 · Accepted Answer

我认为这应该做你想要的。

选择所需的列：

v = c("x", "y")#or
v = colnames(df)[1:2]

用于sapply迭代v并将值传递给tapply：

sapply(v, function(i) tapply(df[[i]], df$group, sd, na.rm=TRUE))

r - 如何将 na.rm 作为参数传递给 tapply？

2 回答 2

Related

Reference