3

我正在尝试创建通用函数来处理具有多个合理值的数据框。我想要的是将公式传递给函数以执行回归,例如:

f <- MRPCM ~ DSEX + IEP + ELL3 + SDRACEM + PARED

MRPCM变量实际上并不存在于数据框中。相反,确实存在五个变量、、MRPCM1MRPCM2和。我想要做的是迭代和更新公式(此处)以创建五个公式。这可以做到吗?该功能似乎一次在整个左侧或右侧工作。我还应该注意,在此示例中,我希望更改的变量是因变量,因此可以正常工作。但是,我不知道变量出现在公式中的什么位置。MRPCM3MRPCM4MRPCM5fupdate.formulaupdate(f, MRPCM1 ~ .)

例如:

f <- MRPCM + DSEX ~ IEP + ELL3 + SDRACEM + PARED

update.formula(f, as.formula('MRPCM1 ~ .'))

结果(请注意,现在缺少 DSEX):

MRPCM1 ~ IEP + ELL3 + SDRACEM + PARED

4

1 回答 1

6

这是一种方法的演示。更复杂的实现可能会更新拟合的线性模型(请参阅 参考资料?update),但这超出了您的问题的直接范围。

## Make a reproducible example!!
df <- 
setNames(as.data.frame(matrix(rnorm(96), ncol=8)), 
         c("MRPCM1","MRPCM2","MRPCM3","DSEX","IEP", "ELL3","SDRACEM","PARED"))

## Construct a template formula
f <- MRPCM ~ DSEX + IEP + ELL3 + SDRACEM + PARED

## Workhorse function
iterlm <- function(formula, data) {
    ## Find columns in data matching pattern on left hand side of formula
    LHSpat <- deparse(formula[[2]])
    LHSvars <- grep(LHSpat, names(data), value = TRUE)
    ## Run through matchded columns, repeatedly updating the formula,
    ## fitting linear model, and extracting whatever results you want. 
    sapply(LHSvars, FUN=function(var) {
        uf <- update.formula(f, as.formula(paste(var, "~ .")))
        coef(lm(uf, df))
    })
}

## Try it
iterlm(f, df)
##                  MRPCM1     MRPCM2      MRPCM3
## (Intercept)  0.71638942 -0.3883355  0.22202700
## DSEX        -0.07048994 -0.7478064  0.62590580
## IEP         -0.22716821 -0.2381982  0.12205780
## ELL3        -0.44492392  0.1720344  0.41251561
## SDRACEM      0.21629235  0.4800773  0.02866802
## PARED        0.07885683 -0.2582598 -0.07996121
于 2012-07-16T20:18:16.203 回答