2

我正在尝试lme4::lmer在计划中拟合一些模型drake,但出现错误

未找到“数据”,公式环境中缺少一些变量

如果我替换一个lm模型,它会起作用。

这是一个可重现的示例

library(drake)
library(lme4)
#> Loading required package: Matrix
#> 
#> Attaching package: 'Matrix'
#> The following object is masked from 'package:drake':
#> 
#>     expand

plan_lm <- drake_plan(
  dat = iris,
  mod = lm(Sepal.Length ~ Petal.Length, data = dat)
)

make(plan_lm)
#> ℹ Consider drake::r_make() to improve robustness.
#> ▶ target dat
#> ▶ target mod

plan_lmer <- drake_plan(
  dat1 = iris,
  mod1 = lmer(Sepal.Length ~ Petal.Length, data = dat1)
)

make(plan_lmer)
#> ▶ target dat1
#> ▶ target mod1
#> x fail mod1
#> Error: target mod1 failed.
#> diagnose(mod1)$error$message:
#>   'data' not found, and some variables missing from formula environment
#> diagnose(mod1)$error$calls:
#>   lme4::lFormula(formula = Sepal.Length ~ Petal.Length, data = dat1, 
#>     control = list("nloptwrap", TRUE, 1e-05, TRUE, FALSE, list(
#>         "ignore", "stop", "ignore", "stop", "stop", "message+drop.cols", 
#>         "warning", "stop"), list(list("warning", 0.002, NULL), 
#>         list("message", 1e-04), list("warning", 1e-06)), list()))
#>   lme4:::checkFormulaData(formula, data, checkLHS = control$check.formula.LHS == 
#>     "stop")
#>   base::stop("'data' not found, and some variables missing from formula environment", 
#>     call. = FALSE)
Created on 2020-07-29 by the reprex package (v0.3.0)

有什么建议么?

4

2 回答 2

4

这个边缘案例是https://github.com/ropensci/drake/issues/1012https://github.com/ropensci/drake/issues/1163的一个实例。drake创建自己的环境来运行命令,因此环境与dat模型实际运行的环境不同。这样做是有充分理由drake的,而且行为不会改变,所以不幸的是,除非lme4改变,否则这个问题是永久性的。我能提供的最佳解决方法是在运行时在目标环境中创建公式,类似于下面的 reprex。您必须手动强制数据和公式处于同一环境中。我建议编写一个自定义函数来执行此操作。

library(drake)
suppressPackageStartupMessages(library(lme4))

fit_lmer <- function(dat) {
  envir <- environment()
  envir$dat <- dat
  f <- as.formula("Reaction ~ Days + (Days | Subject)", env = envir)
  lme4::lmer(f, data = dat)
}

plan <- drake_plan(
  dat = sleepstudy,
  mod = fit_lmer(dat)
)

make(plan)
#> ▶ target dat
#> ▶ target mod

reprex 包(v0.3.0)于 2020 年 7 月 29 日创建

顺便说一句,如果可以的话,请考虑避免使用 iris 数据集:https ://armchairecology.blog/iris-dataset/

于 2020-07-29T02:56:57.253 回答
2

我可以通过在新目标中重新分配来解决这个问题

plan <- drake_plan(
  dat = sleepstudy,
  mod =  {dat <- dat
    lmer(Reaction ~ Days + (Days | Subject), dat)
  }
)
make(plan)

或遵循https://github.com/ropensci/drake/issues/1163,使用readd(dat)

于 2020-07-29T08:26:50.637 回答