我正在使用 RStudio 服务器和降雪。我的并行代码总是给我这些信息:
> sfInit(cpus = 14, parallel = TRUE)
> sfLapply(seq(along = trials), nvtPar, file)
23 Nov 2014 11:31:36 [rsession-users] ERROR svn: E070008: Can't read directory 'my-current-working-directory': Partial results are valid but processing is incomplete
; LOGGED FROM: core::Error session::modules::svn::status(const core::FilePath&, std::vector<session::modules::source_control::FileWithStatus, std::allocator<session::modules::source_control::FileWithStatus> >*) /home/ubuntu/rstudio/src/cpp/session/modules/SessionSVN.cpp:809
在我的并行函数(nvtPar)中,我从硬盘驱动器读取了一些文件并将文件写入硬盘驱动器。所有文件都在子文件夹中。
该服务器构建在具有 16 个内核的 VMware 虚拟服务器上。我的工作目录是 nfs 服务器并安装为我的主目录。
我的 RStudio 服务器是 0.98.994 版。
这是我的会话信息:
> sessionInfo()
R version 3.1.1 (2014-07-10)
Platform: x86_64-unknown-linux-gnu (64-bit)
locale:
[1] LC_CTYPE=en_US.UTF-8 LC_NUMERIC=C LC_TIME=C LC_COLLATE=C LC_MONETARY=C LC_MESSAGES=C LC_PAPER=C
[8] LC_NAME=C LC_ADDRESS=C LC_TELEPHONE=C LC_MEASUREMENT=C LC_IDENTIFICATION=C
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] snowfall_1.84-6 snow_0.3-13 magrittr_1.0.1 XML_3.98-1.1 ncdf4_1.13 dplyr_0.3.0.9000
loaded via a namespace (and not attached):
[1] DBI_0.3.1 Rcpp_0.11.3 assertthat_0.1 lazyeval_0.1.9.9001 parallel_3.1.1 tools_3.1.1
感谢您的任何建议。如果我的问题不清楚,请告诉我。
编辑:作为@roman-luštrik 的建议,我添加了我的最小示例来重现我的问题(抱歉,我无法发布我的整个脚本,但这个示例会产生相同的错误消息)。
trials <- seq(1, 1593)
nvtPar <- function(i, file)
{
# Generate the random string which will store in the disk
MHmakeRandomString <- function(n=1, lenght=12)
{
randomString <- c(1:n) # initialize vector
for (i in 1:n)
{
randomString[i] <- paste(sample(c(0:9, letters, LETTERS),
lenght[i], replace=TRUE),
collapse="")
}
return(randomString)
}
sim <- MHmakeRandomString(2553, round(runif(2553) * 344))
write.table(sim, file = paste0(i, '.sim'),
quote = FALSE,
row.names = FALSE,
col.names = FALSE)
# Do some calculation
Sys.sleep(0.213 * (1 + (runif(1) * 2 - 1)) * 0.4)
# Remove the temp file
file.remove(paste0(i, '.sim'))
# Do other calculaation
Sys.sleep(2.32 * (1 + (runif(1) * 2 - 1)) * 0.1)
}
library(snowfall)
sfInit(cpus = 14, parallel = TRUE)
a <- sfLapply(seq(along = trials), nvtPar, file)
sfStop()
经过挖掘,似乎这个错误与并行计算中的file.remove有关。如果我评论这一行,所有错误都会消失:
file.remove(paste0(i, '.sim'))
顺便说一句:我在工作目录中使用 svn 进行版本控制。