1

我想重新尝试readLines使用tryCatch. 只要我不将其包装在future.apply::future_lapply处理列表或向量的调用中,这将按预期工作。

可以使用以下代码重现该问题:

read_lines_retrying <- function(url, attempts = 5, throttle = 5) {
    result <- NA
    while (is.na(result) && 0 < attempts) {
        attempts <- attempts - 1
        result <- tryCatch(
            {
                readLines(url)
            },
            error = function(cond) {
                message("caught error:")
                message(cond)
                message("")
                Sys.sleep(throttle)
                return(NA)
            }
        )
    }
    if (is.na(result)) {
        stop(paste("could not get URL ", url))
    }
    return(result)
}

urls <- c("http://nonexistant.nonexistant")

future.apply::future_lapply(urls, read_lines_retrying)

当然,代码是用来重试暂时readLines失败的,而示例 URL 总是会失败,但这种方式最容易看出问题。使用lapply代替 时future.apply::future_lapply,至少需要 5 秒才能完成,因为它在 5 次尝试后等待 5 秒。情况并非如此future.apply::future_lapply,表明异常处理不起作用。

我做错了什么,我怎么能tryCatch在里面工作future.apply::future_lapply

4

1 回答 1

1

futureverse的作者在这里:这是一个有趣的问题。

这是一个最小的可重现示例:

boom <- function(x) {
  tryCatch(stop("boom"), error = function(cond) {
    message(1); message(cond); message(2)
  })
}  

y <- lapply(1L, FUN = boom)
## 1
## boom2

y <- future.apply::future_lapply(1L, FUN = boom)
## 1
## Error in doTryCatch(return(expr), name, parentenv, handler) : boom

我们甚至可以用单独的期货重现这一点:

> y <- boom(1)
## 1
## boom2

> f <- future::future(boom(1))
> y <- future::value(f)
## 1
## Error in doTryCatch(return(expr), name, parentenv, handler) ## : boom

首先,事实证明是它message(cond)触发了这种奇怪的行为。例如,如果您改为使用message(conditionMessage(cond)),它可以正常工作。

更新 2022-03-01:在 R-devel 上询问此问题后(线程“消息()和警告()规避调用处理程序并发出原始类的信号,例如错误”于 2022 年 3 月 1 日(https://stat .ethz.ch/pipermail/r-devel/2022-March/081515.html )),我得出结论,使用message(e)wheree是错误条件是不正确的,应该使用message(conditionMessage(e)).

技术细节如下:

发生的情况是message(cond)最终重新发出捕获的错误 (= cond) 的信号。而且,尽管message()在内部消除了错误信号,但事实证明,未来仍然会检测到它并将其视为明确的错误。

我有预感可能会发生什么,但我不能保证快速解决。我现在在https://github.com/HenrikBengtsson/future/issues/507跟踪这个。在解决之前,解决方法是:“避免重新发出刚刚捕获的错误信号”,即不要调用message(cond)warning(cond)出现错误情况。

非常感谢您报告这个重要问题。

PS。请考虑https://github.com/HenrikBengtsson/future/discussions以供将来讨论,因为我只是偶尔略读 StackOverflow。

于 2021-06-03T03:58:52.453 回答