0

我有一个按以下方式布置的数据框:

Species Trait.p  Trait.y   Trait.z
   a      20.1    7.2        14.1
   b      20.4    8.3        15.2
   b      19.2    6.8        13.9

对于每个物种组合,我想申请 (Xa) - (Xb) 其中 X 是特征值,字母是物种,Xa > Xb。即必须使得每个相应物种组合的较大值必须首先出现,针对每个性状计算

这会是一个多步骤的过程吗?

一个示例输出可能是

Combination  Trait.p  Trait.y  Trait.z
    a/b        0.3      1.1      1.1
4

1 回答 1

0

我假设您选择了最大值,但大卫提出了一个很好的观点。我怀疑这是最好的方法,但我认为它可以为您提供您所追求的。请注意,我添加了 ac,因为我确定您的问题比 a 和 b 更复杂:

dat <- read.table(text="Species Trait.p  Trait.y   Trait.z
   a      20.1    7.2        14.1
   b      20.4    8.3        15.2
   b      19.2    6.8        13.9
   c      14.2    3.8        11.9", header=T)

li <- lapply(split(dat, dat$Species), function(x) apply(x[, -1], 2, max))

com <- expand.grid(names(li), names(li))
inds <- com[com[, 1] != com[, 2], ]
inds <- t(apply(inds, 1, sort))
inds <- inds[!duplicated(inds), ]

ans <- lapply(1:nrow(inds), function(i) {
    abs(li[[inds[i, 1]]]-li[[inds[i, 2]]])
})
cbind(Combination = paste(inds[, 1], inds[, 2], sep="/"), 
    as.data.frame(do.call(rbind, ans)))

这给了我们:

  Combination Trait.p Trait.y Trait.z
1         a/b     0.3     1.1     1.1
2         a/c     5.9     3.4     2.2
3         b/c     6.2     4.5     3.3

抱歉没有注释,但我要去上课了。

于 2012-08-30T19:33:58.640 回答