2

我正在尝试计算一长串序列之间的成对差异的数量,并将其放回矩阵形式。这是我想做的一个玩具示例。

library(MiscPsycho)
b <- c("-BC", "ACB", "---") # Toy example of sequences
workb <- expand.grid(b,b)
new <- c(1:9)

# Need to get rid of this for loop somehow
for (i in 1:9) {
new[i] <- stringMatch(workb[i,1], workb[i,2], normalize="NO")
}

workb <- cbind(workb, new)
newmat <- reShape(workb$new, id=workb$Var1, colvar=workb$Var2)

a <- c("Subject1", "Subject2", "Subject3") #Relating it back to the subject ID
colnames(newmat) <- a
rownames(newmat) <- a
newmat

我对使用 apply 函数不是很熟悉,但我想用它来替换 for 循环,考虑到我有大量序列,这可能会变慢。(stringMatch 函数来自 MiscPsycho)。请让我知道如何提高效率!

非常感谢!

4

3 回答 3

2

为了获得那些“成对距离”,我会做类似的事情:

  Vm <- Vectorize(stringMatch)
  nex <- outer(b,b, FUN=Vm, normalize = "NO")
 nex
     [,1] [,2] [,3]
[1,]    0    3    2
[2,]    3    0    3
[3,]    2    3    0
于 2012-06-19T19:38:51.393 回答
0

更换循环

new <- apply(workb, 1, function(x) stringMatch(x[[1]],x[[2]], normalize="NO"))
于 2012-06-19T18:44:50.387 回答
0

我会做一个函数来获取你的索引i,和返回new[i]

myfun <- function(i) {
  stringMatch(workb[i, 1], workb[i, 2], normalize='NO')
}

然后你可以apply沿着你的新向量:

workb$new <- unlist(lapply(new, myfun))

通常,您for loop在 R 中正确使用了 a 。您已经预先分配了向量new并且正在填充它而不是增长它。

于 2012-06-19T18:45:15.910 回答