我希望能够将列名发送给我正在拨打的电话ddply
。一个示例ddply
调用:
ddply(myData, .(MyGrouping), summarise, count=sum(myColumnName))
如果我已经ddply
包装在另一个函数中,是否可以包装它以便我可以将任意值传递myColumnName
给调用函数?
必须有更好的方法。而且我不知道如何使它与摘要一起使用。
my.fun <- function(df, count.column) {
ddply(df, .(x), function(d) sum(d[[count.column]]))
}
dat <- data.frame(x=letters[1:2], y=1:10)
> my.fun(dat, 'y')
x V1
1 a 25
2 b 30
>
正如@David Arenburg 所说,这个问题已经很老了。今天,无论是data.table
或dplyr
包都可以以更快的速度为您提供相同的结果。
这是data.table
答案的版本。
library(data.table)
my.fun <- function(myData, MyGrouping, myColumnName) {
setDT(myData)[, lapply(.SD, sum), by=MyGrouping, .SDcols=myColumnName]
}
我想我找到了一种适用于摘要的方法。我不确定我是否理解为什么,因为我不是处理 R 环境的专家,但这是解决方案:
> library(plyr)
>
>
>
> ###########################
> # Creating test DataFrame #
> ###########################
>
> x <- 1:15
>
> set.seed(1)
> y <- letters[1:3][sample(1:3, 15, replace = T)]
>
> df <- data.frame(x, y)
>
> ### check df
> df
x y
1 1 a
2 2 b
3 3 b
4 4 c
5 5 a
6 6 c
7 7 c
8 8 b
9 9 b
10 10 a
11 11 a
12 12 a
13 13 c
14 14 b
15 15 c
>
>
> #####################
> # auxiliar function #
> #####################
> evalString <- function(s) {
+ eval(parse(text = s), parent.frame())
+ }
>
>
> ### columnName input
> columnName <- 'x'
>
> ### call with columnName as input
> xMeans <- ddply(df,
+ 'y',
+ summarise,
+ mean = mean(evalString(columnName)))
>
>
> ### regular call to ddply
> xMeans2 <- ddply(df,
+ 'y',
+ summarise,
+ mean = mean(x))
>
>
> ### Compare Results
> xMeans
y mean
1 a 7.8
2 b 7.2
3 c 9.0
> xMeans2
y mean
1 a 7.8
2 b 7.2
3 c 9.0
>
编辑:您可以使用get
基本包中的函数,如下所示:ddply:如何将列名作为参数传递?
> xMeans3 <- ddply(df,
+ 'y',
+ summarise,
+ mean = mean(get(columnName)))
>
> xMeans3
y mean
1 a 7.8
2 b 7.2
3 c 9.0