在分组数据框中,我想应用一个函数,将实际 a 行中的一个值与该组(和同一列)的所有其他值(当前行中的 i 除外)相关联。这将导致一个单值的新变量。因此,如果该组由 c(1,2,3,4,5) 组成,我希望有一个新变量: c(fun(1,c(2,3), fun(2, c(1,3) ), fun(3, c(1,2)) 我的组没有相似的大小。但是尝试了这么长时间,我总是收到有趣的值,例如零或错误。
示例代码:
set.seed(3)
dat <- data_frame(a=1:10,value=round(runif(10),2),group=c(1,1,1,2,2,3,3,3,3,4))
# one possible function
dif.dist <- function(x1, x2) sum(abs(x1 - x2))/(length(x2)-1)
# with this, sometimes the grouping gets lost in "vec" and i receive zeros
x <- dat%>%
group_by(group)%>%
mutate(vec= list(value))%>%
mutate(dif = dif.dist(unique(value),unlist(vec)[unlist(vec)!=value]))%>%
ungroup()
# another try with plyr, that returns only 0
dat <- ddply(dat, .(group), mutate, dif=dif.dist1(value[a==a],value[value!=value[a==a]]))
但该功能有效
dif.dist(dat$value[1],dat$value[2:3])
[1] 0.85
后来,我需要它来接收与每个参与者相关的大量变量的距离矩阵。我会感谢帮助!