这是一个非常简单的例子。
df = c("already ","miss you","haters","she's cool")
df = data.frame(df)
library(doParallel)
cl = makeCluster(4)
registerDoParallel(cl)
foreach(i = df[1:4,1], .combine = rbind, .packages='tm') %dopar% classification(i)
stopCluster(cl)
在实际情况下,我有 n=400000 行的数据框。我不知道如何一步发送每个集群的 nrow/ncluster 数据,i = ?
我尝试使用 library(itertools) 中的 isplitRows 没有成功。