社区,
我有一个非常大的数据集,其中包含 3 列坐标(x、y、z)和 24 x 10^6 行。我需要计算所有行与第一行之间的欧几里得距离,即 0、0、0。下面的循环需要很长时间!我也在矩阵而不是数据框上尝试过这个,但这并没有解决问题。
有没有人有加快这个过程的建议?
library(cluster)
e <- list() # list to be filled with euclidean distances
for (r in 1:(nrow(pca.123.df))) {
eucl.dist <- daisy(pca.123.df[c(1,r), ], metric = "euclidean") # Euclidean distance between anomaly and zero (row 1)
e[[r]] <- eucl.dist[1]
}