0

我真的在这里挠头。我真的不明白发生了什么。这是一个 MWE,但实际代码和目的比这更复杂。所以代码:

library(dplyr)
ds <- mutate(iris, Species = as.numeric(Species == 'setosa'))

ds %>%
    do_(
        .dots = lazyeval::interp(
            "broom::tidy(stats::glm(form, data = ., family = distr))",
            form = Species ~ Sepal.Length,
            distr = binomial()
        )
    )

返回:Error in family$linkfun(mustart) : object 'C_logit_link' not found...但此代码位工作正常:

ds %>%
    do_(
        .dots = lazyeval::interp(
            "broom::tidy(stats::glm(form, data = ., family = distr))",
            form = Sepal.Width ~ Sepal.Length,
            distr = gaussian()
        )
    )

两者之间的唯一区别是使用的家庭分布(高斯与二项式)和使用的变量。

所以问题是:为什么lazyeval 找不到C_logit_link

4

1 回答 1

1

当您调用时interp(x, *),它会计算要插入的参数x。在 的情况下binomial(),结果是一个表示 GLM 中二项式分布的结构。

interp(~x, x=binomial())

#~list(family = "binomial", link = "logit", linkfun = function (mu) 
#.Call(C_logit_link, mu), linkinv = function (eta) 
#.Call(C_logit_linkinv, eta), variance = function (mu) 
#mu * (1 - mu), dev.resids = function (y, mu, wt) 
#.Call(C_binomial_dev_resids, y, mu, wt), aic = function (y, n, 
#    mu, wt, dev) 
#{
#    m <- if (any(n > 1)) 
#    . . .

埋在该结构中的是一个函数,它通过 object 调用已编译的 C 代码C_logit_link。这是 stats 包中未导出的对象。通常一切正常,因为该函数的环境是 stats 命名空间,因此它能够找到C_logit_link.

这里的问题是您要插入的对象是一个字符串,这意味着插入其中的所有内容也被强制转换为字符串。即失去查找所需的环境信息C_logit_link

解决方案是改为插入公式:

library(dplyr)
ds <- mutate(iris, Species = as.numeric(Species == 'setosa'))

ds %>%
    do_(
        .dots = lazyeval::interp(
            ~broom::tidy(stats::glm(form, data = ., family = distr)),  # formula
            form = Species ~ Sepal.Length,
            distr = binomial()
        )
    )

#          term  estimate std.error statistic      p.value
#1  (Intercept) 27.828521 4.8275611  5.764509 8.189574e-09
#2 Sepal.Length -5.175698 0.8933984 -5.793270 6.902910e-09
于 2017-03-11T17:40:52.807 回答