0

我遇到了一些我无法弄清楚的奇怪的德雷克行为。我正在尝试在.rmd我的德雷克计划中添加一个。我正在使用远程机器和该机器上的网络驱动器。如果我尝试将 .rmd 文件添加到我的计划中,如下所示:

> library(drake)
> library(rmarkdown)
> 
> list.files()
[1] "drake_testing.Rproj"        "foo.png"             "report.Rmd"                    
> 
> plan <- drake_plan(
+   png("foo.png"),
+   plot(iris$Sepal.Length ~ iris$Sepal.Width),
+   dev.off(),
+   report = render(
+     input = knitr_in("report.Rmd"),
+     output_file = "report.html",
+     quiet = TRUE
+   )
+   
+ )
> 
> plan
# A tibble: 4 x 2
  target         command                                                                               
  <chr>          <expr>                                                                                
1 drake_target_1 png("foo.png")                                                                        
2 drake_target_2 plot(iris$Sepal.Length ~ iris$Sepal.Width)                                            
3 drake_target_3 dev.off()                                                                             
4 report         render(input = knitr_in("report.Rmd"), output_file = "report.html",      quiet = TRUE)
> 
> ## Turn your plan into a set of instructions
> config <- drake_config(plan)
Error: The specified file is not readable: report.Rmd
> 
> traceback()
13: stop(txt, obj, call. = FALSE)
12: .errorhandler("The specified file is not readable: ", object, 
        mode = errormode)
11: digest::digest(object = file, algo = config$hash_algorithm, file = TRUE, 
        serialize = FALSE)
10: rehash_file(file, config)
9: rehash_storage(target = target, file = file, config = config)
8: FUN(X[[i]], ...)
7: lapply(X = X, FUN = FUN, ...)
6: weak_mclapply(X = keys, FUN = FUN, mc.cores = jobs, ...)
5: lightly_parallelize_atomic(X = X, FUN = FUN, jobs = jobs, ...)
4: lightly_parallelize(X = knitr_files, FUN = storage_hash, jobs = config$jobs, 
       config = config)
3: cdl_get_knitr_hash(config)
2: create_drake_layout(plan = plan, envir = envir, verbose = verbose, 
       jobs = jobs_preprocess, console_log_file = console_log_file, 
       trigger = trigger, cache = cache)
1: drake_config(plan)

我尝试了以下排列来完成这项工作:

  • 将 移动.rmd到本地驱动器并使用完整路径调用它
  • 添加file.path内部和外部knitr_in以完成完整路径。
  • 尝试使用file_in上述每个场景。

我也尝试过调试,但是当德雷克将文件名转换为哈希然后将其转换回文件的基本名称时,我有点迷失了(即report.Rmd)。错误最终在digest::digest被调用时发生。

有没有人有尝试弄清楚这样的事情的经验?

4

1 回答 1

2

digest("report.Rmd", file = TRUE)我认为答案取决于您在外部调用时是否遇到相同的错误drake_config(plan)。如果它出错(我打赌它确实出错了),你的文件系统可能会与 R 发生冲突。如果是这种情况,那么不幸的是drake无能为力。

我还建议对您的计划进行一些更改:

plan <- drake_plan(
  plot_step = {
    png(file_out("foo.png")),
    plot(iris$Sepal.Length ~ iris$Sepal.Width),
    dev.off()
  },
  report = render(
    input = knitr_in("report.Rmd"),
    output_file = "report.html",
    quiet = TRUE
  )  
)

或者更好的是,将您的工作划分为可重用的函数:

plot_foo = function(filename) {
  png(filename),
  plot(iris$Sepal.Length ~ iris$Sepal.Width),
  dev.off()
}

plan <- drake_plan(
  foo = plot_foo(file_out("foo.png")),
  report = render(
    input = knitr_in("report.Rmd"),
    output_file = "report.html",
    quiet = TRUE
  )  
)

目标是具有有意义的返回值和/或输出文件的可跳过工作流步骤。png()并且dev.off()是绘图步骤的一部分,并file_out()告诉drake注意foo.png变化。此外,命名目标也是一个好习惯。通常,目标的返回值是有意义的,就像 R 中的变量一样。

于 2019-08-22T16:03:56.923 回答