1

我想从 data.frame 中总结几列。分组和汇总是通过 实现的dplyr,如下例所示。

df = data.frame (time = rep(c("day", "night"), 10) , 
    who =rep(c("Paul", "Simon"), each=10) , 
    var1 = runif(20, 5, 15), var2 = runif(20, 10, 12), var3 = runif(20, 2, 7), var4 = runif(20, 1, 3)) 

编写我需要的函数

quantil_x = function (var, num) { quantile(var, num, na.rm=T) }

使用它var1并导出

percentiles = df %>% group_by(time, who) %>% summarise(
    P0 = quantil_x (var1, 0),
    P25 = quantil_x (var1, .25),
    P75 = quantil_x (var1, .75)
    )
write.table(percentiles, file = "summary_var1.csv",row.names=FALSE, dec=",",sep=";")

我想要的是对'var2','var3'和重复同样的任务'var4'。我试图运行一个循环但没有成功多次执行此任务。不幸的是,我找不到一种方法来处理代码中不同的变量调用。也就是说,在我尝试使用的循环内summarise_(),尝试get()在函数内部quantil_x() 或内部使用summariseas.name但这些都不起作用。

我很确定这是一个糟糕的编码技能问题,但这就是我迄今为止想出的全部。这是我尝试做的一个例子:

list = c("var1", "var2", "var3", "var4")
for (i in list){
percentiles = df %>% group_by(time, who) %>% summarise(
    P0 = quantil_x (get(i), 0),
    P25 = quantil_x (get(i), .25),
    P75 = quantil_x (get(i), .75)
    )
write.table(percentiles, file = paste0("summary_",i,".csv",row.names=FALSE, dec=",",sep=";")
}

我读了这篇文章,但对我的案子没有太大帮助。

提前致谢。

4

2 回答 2

4

你可以这样做summarise_each()

df %>% 
 group_by(time, who) %>% 
 summarise_each(funs (`0` = quantile(., 0, na.rm=T),
                      `25`= quantile(., .25, na.rm = T),
                      `75`= quantile(., .75, na.rm = T)))
于 2017-03-06T20:00:08.503 回答
1

你可以这样做gather()

percentiles = df %>%
gather(Var,Value,var1,var2,var3) %>%
 group_by(Var,time, who) %>%
 summarise(
    P0 = quantil_x (Value, 0),
    P25 = quantil_x (Value, .25),
    P75 = quantil_x (Value, .75)
    )
于 2017-03-06T19:47:57.167 回答