r - 以列名为条件的行和

Question

我的 data.frage 看起来像这样：

   VAR1 VAR2 AUS1 AUS2 AUS3 AUS4 ... AUS56 VAR3 VAR4
   A    D    23   234  34   856  ... 99    0    FCK
   B    D    55   76   55   36   ... 6456  0    XYC

我希望 R 添加一个新变量AUS，该变量显示变量的行AUS1和AUS56，最好使用 dplyr。然后可以删除AUS1。AUS56

score 3 · Accepted Answer

您可以尝试rowSums结合使用grep：

df %>% mutate(AUS_sum = rowSums(.[grep("AUS", names(.))]))

score 2 · Accepted Answer

tidyverse这是使用语法的另一个选项

library(tidyverse)
df1 %>% 
     select(matches("AUS")) %>% 
     reduce(`+`) %>%
     mutate(df1, AUS_sum = .)
#   VAR1 VAR2 AUS1 AUS2 AUS3 AUS4 AUS56 VAR3 VAR4 AUS_sum
#1    A    D   23  234   34  856    99    0  FCK    1246
#2    B    D   55   76   55   36  6456    0  XYC    6678

dplyr使用（即将发布）的开发版本，0.6.0我们可以创建一个函数quosures并使其更具动态性。在这里，通过获取输入参数并将其转换为，我们执行与fromenquo类似的功能，我们将其转换为字符串，其中接受字符串参数。lhs 名称也可以创建为字符串 ('newN')，在中，我们取消引用 (或) 来评估字符串substitutebase Rquosurequo_namematchesmutate/summarise/group_by!!UQ

fSum <- function(dat, pat){
  pat <- quo_name(enquo(pat))
  newN <- paste0(pat, "_sum")
  newSum <- dat %>%
            select(matches(pat)) %>%
            reduce(`+`)
  dat %>%
      mutate(!!newN :=  newSum)
}

fSum(df1, AUS)
#    VAR1 VAR2 AUS1 AUS2 AUS3 AUS4 AUS56 VAR3 VAR4 AUS_sum
#1    A    D   23  234   34  856    99    0  FCK    1246
#2    B    D   55   76   55   36  6456    0  XYC    6678

根据 OP 对另一篇关于删除用于的列的帖子的评论sum，我们可以修改函数

fSumN <- function(dat, pat){
  pat <- quo_name(enquo(pat))
  newN <- paste0(pat, "_sum")
  newSum <- dat %>%
            select(matches(pat)) %>%
            reduce(`+`)
  dat %>%
       select(-matches(pat)) %>%
       mutate(!!newN :=  newSum)
}

fSumN(df1, AUS)
#     VAR1 VAR2 VAR3 VAR4 AUS_sum
#1    A    D    0  FCK    1246
#2    B    D    0  XYC    6678

数据

df1 <- structure(list(VAR1 = c("A", "B"), VAR2 = c("D", "D"), AUS1 = c(23L, 
55L), AUS2 = c(234L, 76L), AUS3 = c(34L, 55L), AUS4 = c(856L, 
36L), AUS56 = c(99L, 6456L), VAR3 = c(0L, 0L), VAR4 = c("FCK", 
"XYC")), .Names = c("VAR1", "VAR2", "AUS1", "AUS2", "AUS3", "AUS4", 
 "AUS56", "VAR3", "VAR4"), class = "data.frame", row.names = c(NA, 
-2L))

score 0 · Accepted Answer

0

在基础 R 中：

df$AUS <- rowSums(df[,grep('AUS', names(df))])

于 2017-04-20T10:14:30.290 回答

r - 以列名为条件的行和

3 回答 3

数据

Related

Reference