8

计算两个数据表之和时,NA+n=NA.

> dt1 <- data.table(Name=c("Joe","Ann"), "1"=c(0,NA), "2"=c(3,NA))
> dt1
   Name  1  2
1:  Joe  0  3
2:  Ann NA NA
> dt2 <- data.table(Name=c("Joe","Ann"), "1"=c(0,NA), "2"=c(2,3))
> dt2
   Name  1 2
1:  Joe  0 2
2:  Ann NA 3
> dtsum  <- rbind(dt1, dt2)[, lapply(.SD, sum), by=Name]
> dtsum
   Name  1  2
1:  Joe  0  5
2:  Ann NA NA

我不想用 0 替换所有 NA。我想要的是NA+NA=NANA+n=n得到以下结果:

   Name  1  2
1:  Joe  0  5
2:  Ann NA  3

这是如何在 R 中完成的?

更新:删除了 dt1 中的错字

4

2 回答 2

11

您可以定义自己的功能以按照您的意愿行事

plus <- function(x) {
 if(all(is.na(x))){
   c(x[0],NA)} else {
   sum(x,na.rm = TRUE)}
 }


rbind(dt1, dt2)[,lapply(.SD, plus), by = Name]
于 2013-02-24T23:19:46.500 回答
4
dtsum  <- rbind(dt1, dt2)[, lapply(.SD, function(x) ifelse(all(is.na(x)), as.numeric(NA), sum(x, na.rm=T))), by=Name]

(包括@Arun 的建议) na.rm=TRUE非常好记

于 2013-02-24T23:06:36.350 回答