我在使用 R 中的 multidplyr 对少数核心进行计算时遇到问题。我有一个数据,我给它一个数字(数据将按数字分组,数字 1 的数据将被感知到集群 1 等),如下面的代码:
cores <- numCores - 4
group <- rep(1:cores, length.out = nrow(dane))
dane <- bind_cols(tibble(group), dane)
cluster <- multidplyr::new_cluster(cores)
dane <-
dane %>%
group_by(group) %>%
partition(cluster)
此外,我发送到每个将计算库、其他值和函数的集群。
数据拆分并发送到集群后,我想开始计算并收集结果:
dane %>% select() %>% distinct() %>% ...
但不幸的是我有这个错误,我不知道如何解决这个问题[而不是 distinct(),我使用唯一但其他错误显示。]
“命令'UseMethod(“distinct”)'中的错误:'distinct'的不适用方法应用于类对象“multidplyr_party_df””