我正在尝试在 R 中编写一个接受如下公式的函数:
y ~ 1 + sex + age + (1 | school) + (1 | school:section)
有没有一种简单的方法可以提取该公式的各个组成部分以用于我的函数?例如,我希望能够获得左侧、每个变量、随机效应变量以及它们的嵌套方式等。
有比走公式解析树更简单的方法吗?
如果您想要一个不需要正则表达式的解决方案,我建议您考虑terms
.
form <- y ~ 1 + sex + age + (1 | school) + (1 | school:section)
terms(form)
## y ~ 1 + sex + age + (1 | school) + (1 | school:section)
## attr(,"variables")
## list(y, sex, age, 1 | school, 1 | school:section)
## attr(,"factors")
## sex age 1 | school 1 | school:section
## y 0 0 0 0
## sex 1 0 0 0
## age 0 1 0 0
## 1 | school 0 0 1 0
## 1 | school:section 0 0 0 1
## attr(,"term.labels")
## [1] "sex" "age" "1 | school" "1 | school:section"
## attr(,"order")
## [1] 1 1 1 1
## attr(,"intercept")
## [1] 1
## attr(,"response")
## [1] 1
## attr(,".Environment")
## <environment: R_GlobalEnv>
此外,您可以使用以下方法从中提取属性attributes
:
attributes(terms(form))$term.labels
## [1] "sex" "age" "1 | school" "1 | school:section"
要扩展@Ben Bolker 的建议:
f1 <- formula(y ~ 1 + sex + age + (1 | school) + (1 | school:section))
左侧(假设左侧有一个变量):
all.vars(terms(f1))[1] # character
变量:
all.vars(delete.response(terms(f1))) # character
随机效应:
lme4:::findbars(f1) # returns list of language items
还有这个formula.tools
包,虽然它没有专门用于混合效果模型的方法:
library(formula.tools)
lhs(f1)
r1 <- rhs.vars(f1) # gives fixed and random effects as character
r1[grepl("\\|", r1)] # character vector of random effects
也许是这样的:
x <- as.formula("y ~ 1 + sex + age + (1 | school) + (1 | school:section)")
x[[2]]
x[[3]][2]
你也可以使用strsplit
:
strsplit(as.character(x[[3]][2]), "\\+")
> form <- y ~ 1 + sex + age + (1 | school) + (1 | school:section)
> form[1]
`~`()
> form[2]
y()
> form[3]
1 + sex + age + (1 | school) + (1 | school:section)()
所以基本上你应该将 LHS 和 RHS 作为列表元素来处理。要拆分 RHS,您可以使用 TylerRinker 的答案。