我想从 data.frame 中总结几列。分组和汇总是通过 实现的dplyr
,如下例所示。
df = data.frame (time = rep(c("day", "night"), 10) ,
who =rep(c("Paul", "Simon"), each=10) ,
var1 = runif(20, 5, 15), var2 = runif(20, 10, 12), var3 = runif(20, 2, 7), var4 = runif(20, 1, 3))
编写我需要的函数
quantil_x = function (var, num) {
quantile(var, num, na.rm=T)
}
使用它var1
并导出
percentiles = df %>% group_by(time, who) %>% summarise(
P0 = quantil_x (var1, 0),
P25 = quantil_x (var1, .25),
P75 = quantil_x (var1, .75)
)
write.table(percentiles, file = "summary_var1.csv",row.names=FALSE, dec=",",sep=";")
我想要的是对'var2'
,'var3'
和重复同样的任务'var4'
。我试图运行一个循环但没有成功多次执行此任务。不幸的是,我找不到一种方法来处理代码中不同的变量调用。也就是说,在我尝试使用的循环内summarise_()
,尝试get()
在函数内部quantil_x()
或内部使用summarise
,as.name
但这些都不起作用。
我很确定这是一个糟糕的编码技能问题,但这就是我迄今为止想出的全部。这是我尝试做的一个例子:
list = c("var1", "var2", "var3", "var4")
for (i in list){
percentiles = df %>% group_by(time, who) %>% summarise(
P0 = quantil_x (get(i), 0),
P25 = quantil_x (get(i), .25),
P75 = quantil_x (get(i), .75)
)
write.table(percentiles, file = paste0("summary_",i,".csv",row.names=FALSE, dec=",",sep=";")
}
我读了这篇文章,但对我的案子没有太大帮助。
提前致谢。