0

我想这是 R 用户中一个非常常见的问题,但我仍然不清楚。我想解析列 fnl3$aaa 的所有元素,并为每个元素在列 df$aaa 中执行查找。如果发生匹配,则在临时向量的末尾附加一个数值。我的问题是这个过程需要很长时间才能完成。所以我想知道我怎样才能让它跑得更快。有任何想法吗?

cur <- c("")
for (i in 1:unq21) {
   prev <- cur
   for (j in 1:unq11) {
      if (cnt1$aaa[j] == fnl3$aaa[i]) {
         print('MATCH!!!')
         print(cnt1$freq[j])
         print(fnl3$V1[i])
         cur <- append(prev, as.vector(fnl3$V1[i] / cnt1$freq[j]), after = 0)
      }
   }
}

样本数据集:

fnl3
    row.names   aaa                                    V1
1   404     1DC8F216-9138-4151-ABD6-36C3C2C75001        3
2   1533    638DF397-359E-43A5-A2F7-2C43CABA93DA        3
3   14      015ee60dbf299f5419eed89214b7409a            2
4   98      08CFF963-5565-4B8C-814E-FDFA5D37DCD6        2
5   488     226afbbac8dfd6f3c27cb16f9d7922a2            2

cnt1
    aaa                                         freq
1   000089f457881d57d4f221948c2b808c            1
2   00081dd2fd542a2a9c64a8990a1fc986601ab318    1
3   0021a8971f976743c2043b60e38eab46            1
4   0034d5d368611e33d7cfcda85df96eba            1
5   00379FA3-07A6-4AF7-ACBC-721E2E33DD67        1
4

1 回答 1

2

首先,用于构建列匹配merge的data.frame :aaa

m <- merge(fnl3, cnt1, by = "aaa")

然后,您可以通过简单地执行以下操作来计算您存储的向量cur

with(m, V1 / freq)

您可以在一个电话中完成所有操作:

with(merge(fnl3, cnt1, by = "aaa"), V1 / freq)
于 2013-08-26T11:06:48.273 回答