r - 使用带有 emmeans 的抽象公式

Question

我正在使用emmeans对数转换来调整方法。

但出乎意料的是，当我尝试使用自定义函数调用它时，行为完全不同，没有明确的警告（除了关于日志转换的警告）。

这是一个可重现的示例：

db = mtcars %>% mutate(cyl=factor(cyl))
m = lm(log(mpg) ~ log(disp) + cyl, data = db)
print(m$call)
emm = emmeans(m, spec = "cyl", type = "response")
as.data.frame(emm)

f = function(formula){
  m = lm(formula, data = db)
  print(m$call)
  emm = emmeans(m, spec = "cyl", type = "response")
  as.data.frame(emm)
}
f(log(mpg) ~ log(disp) + cyl)

在这里，函数内部和外部模型之间的唯一区别是call对象（用测试all.equal()）。否则，它们会给出完全相同的结果。

这段代码不是我的，我只是想自动化它，假设“外部函数”输出是正确的。

为什么输出不一样？如何使emmeans呼叫自动化？

score 1 · Accepted Answer

这是一个范围问题（公式有一个相关的环境，取决于它们的创建方式/位置）。lm您可以通过计算语言将公式插入到调用中：

f = function(formula){
  m = eval(bquote(lm(.(formula), data = db)))
  print(m$call)
  emm = emmeans(m, spec = "cyl", type = "response")
  as.data.frame(emm)
}

score 1 · Accepted Answer

如此处所述，这也可以使用do.call.


db = dplyr::mutate(mtcars, cyl=factor(cyl))

f <- function(formula){
  m = do.call(lm, list(formula = formula, data = db))
  print(m$call$formula)
  emm = emmeans::emmeans(m, spec = "cyl", type = "response")
  as.data.frame(emm)}

f(log(mpg) ~ log(disp) + cyl)
#> log(mpg) ~ log(disp) + cyl
#>   cyl response       SE df lower.CL upper.CL
#> 1   4 18.59940 1.847377 28 15.17535 22.79603
#> 2   6 17.71003 1.011478 28 15.75472 19.90802
#> 3   8 17.71054 1.020718 28 15.73839 19.92981

^{由reprex 包（v0.3.0）于 2021-07-08 创建}

r - 使用带有 emmeans 的抽象公式

2 回答 2

Related

Reference