r - R：是否可以矢量化/加速这个双循环？

Question

这是一个高层次的一般性问题。周围有一些类似的例子，但有不同的、更简洁的例子。或许无法回答。conn是一个矩阵。

     for (i in 2:dim(conn)[1]) {
        for (j in 2:dim(conn)[1]) {
          if ((conn[i, 1] == conn[1, j]) & conn[i, 1] != 0) {
              conn[i, j] <- 1
              conn[j, i] <- 1
              }
              else {
                conn[i, j] <- 0
                conn[j, i] <- 0
                }
           }
      }

这直接cluscomp来自 clusterCons 包。

我的问题很简单：是否可以加快循环或将其矢量化？作为 R 初学者，我看不到它，也不想以挫败感告终，因为这可能是不可能的。我会接受任何可以说是或否的答案，并暗示可能涉及的工作量。

score 2 · Accepted Answer

这是我将如何编写它，outer用作双循环的替代品。请注意，它仍然进行了比需要更多的计算，但肯定更快。我假设conn是一个方阵。

原代码：

f1 <- function(conn) {
   for (i in 2:dim(conn)[1]) {
      for (j in 2:dim(conn)[1]) {
         if ((conn[i, 1] == conn[1, j]) & conn[i, 1] != 0) {
            conn[i, j] <- 1
            conn[j, i] <- 1
         } else {
            conn[i, j] <- 0
            conn[j, i] <- 0
         }
      }
   }
   return(conn)
}

我的建议：

f2 <- function(conn) {
   matches <- 1*outer(conn[-1,1], conn[1,-1], `==`)
   matches[conn[-1,1] == 0, ] <- 0
   ind <- upper.tri(matches)
   matches[ind] <- t(matches)[ind]
   conn[-1,-1] <- matches
   return(conn)
}

一些样本数据：

set.seed(12345678)
conn <- matrix(sample(1:2, 5*5, replace=TRUE), 5, 5)
conn
#      [,1] [,2] [,3] [,4] [,5]
# [1,]    2    2    1    2    1
# [2,]    1    1    2    2    1
# [3,]    2    2    1    2    1
# [4,]    2    2    2    2    1
# [5,]    1    1    2    2    1

结果：

f1(conn)
#      [,1] [,2] [,3] [,4] [,5]
# [1,]    2    2    1    2    1
# [2,]    1    0    1    1    0
# [3,]    2    1    0    0    1
# [4,]    2    1    0    1    0
# [5,]    1    0    1    0    1

identical(f1(conn), f2(conn))
# [1] TRUE

一个更大的例子，时间比较：

set.seed(12345678)
conn <- matrix(sample(1:2, 1000*1000, replace=TRUE), 1000, 1000)

system.time(a1 <- f1(conn))
# user  system elapsed 
# 59.840   0.000  57.094 

system.time(a2 <- f2(conn))
# user  system elapsed 
# 0.844   0.000   0.950 

identical(a1, a2)
# [1] TRUE

也许不是你能得到的最快的方法（我相信这里的其他人可以使用例如编译器或 Rcpp 找到更快的方法），但我希望对你来说足够短和快。

编辑：由于已经指出（从该代码的提取位置的上下文中）这conn是一个对称矩阵，我的解决方案可以缩短一点：

f2 <- function(conn) {
   matches <- outer(conn[-1,1], conn[1,-1],
                    function(i,j)ifelse(i==0, FALSE, i==j)) 
   conn[-1,-1] <- as.numeric(matches)
   return(conn)
}

score 2 · Accepted Answer

非矩阵解决方案 - 应该非常快，假设 conn 是非负和对称的......

connmake = function(conn){
  ordering = order(conn[,1])
  breakpoints = which(diff(conn[ordering,1]) != 0)
  if (conn[ordering[1], 1] != 0){
    breakpoints = c(1, breakpoints + 1, nrow(conn) + 1)
  } else {
    breakpoints = c(breakpoints + 1, nrow(conn) +1)
  }
  output = matrix(0, nrow(conn), nrow(conn))

  for (i in 1:(length(breakpoints) - 1)){
    output[ ordering[breakpoints[i]:(breakpoints[i+1] -1)],
        ordering[breakpoints[i]:(breakpoints[i+1] -1)]] =  1
  }
  output[,1] = conn[,1]
  output[1,] = conn[,1]
  output
}

一些使用早期基准测试的测试代码。（原代码实现为orig()，f2()是较早的建议。）

size = 2000
conn  = matrix(0, size, size)
conn[1,] = sample( 1:20, size, replace = T)
conn[,1] = conn[1,]

system.time(orig(conn) -> out1)
#user  system elapsed 
#20.54    0.00   20.54 
system.time(f2(conn) -> out2)
#user  system elapsed
#0.39    0.02    0.41 
system.time(connmake(conn) -> out3)
#user  system elapsed 
#0.02    0.00    0.01 
identical(out1, out2)
#[1] TRUE
identical(out1, out3)
#[1] TRUE

请注意，对于包含 0 的 conn，f2 实际上会失败，但不是我的问题，是吗？可以通过例如将相关值增加一个安全偏移量来简单地处理带有负值的 conn。非对称连接需要更多的思考，但应该是可行的......

一般的教训是排序比成对比较快。成对比较是 O(N^2)，而 R 中最慢的排序算法是 O(N^4/3)。一旦数据被排序，比较就变得微不足道了。

score 1 · Accepted Answer

有几件事浮现在脑海。

首先，您可以通过仅遍历对角线下方或对角线上方的条目将时间减少一半。如果矩阵是方形的，任何一个都可以。如果dim(conn)[1] > dim(conn)[2]那时你会想使用类似的东西循环通过左下角的三角形

for (j in 2:dim(conn)[2]) {
  for (i in j:dim(conn)[1]) {
    ...
  }
}

其次，人们可能会尝试使用apply它，因为它们通常会产生显着的时间减少。但是，在这种情况下，每个 [i,j] 单元格同时引用列头[1,j]和行头[i,1]，这意味着我们不能只将单元格、行或列发送到 *pply。为了代码清晰，我可能会保留for循环。任何有效的基于 *pply 的技巧都会非常聪明，以至于一年后我会忘记它是如何工作的。

最后，这似乎是一个经典示例，使用从 R 调用的 C 会快得多。这似乎需要做很多工作，但它比您想象的要容易得多，即使（对于这个特定示例）如果你不知道 C。第一个对我有意义的从 R 调用 C 的简短示例是here，但它没有利用 Rcpp，所以我不会停在那里。或者，如果您从工作 Rcpp 代码的任何简单示例开始，那么您可以在此处对其进行修改以执行您想要的操作。如果你只是想修改别人的代码，从这个 StackOverflow 线程开始。

r - R：是否可以矢量化/加速这个双循环？

3 回答 3

Related

Reference