我有一个 8 列的 x 矩阵。我想跑glmnet
来做一个套索回归。我知道我需要致电:
glmnet(x, y, family = "binomial", ...).
但是,我如何x
同时考虑所有单向交互?我是否必须手动重新制作数据框:如果是这样,有没有更简单的方法?我想我希望使用 R 公式做一些事情。
我有一个 8 列的 x 矩阵。我想跑glmnet
来做一个套索回归。我知道我需要致电:
glmnet(x, y, family = "binomial", ...).
但是,我如何x
同时考虑所有单向交互?我是否必须手动重新制作数据框:如果是这样,有没有更简单的方法?我想我希望使用 R 公式做一些事情。
是的,有一种方便的方法。其中两个步骤很重要。
library(glmnet)
# Sample data
data <- data.frame(matrix(rnorm(9 * 10), ncol = 9))
names(data) <- c(paste0("x", 1:8), "y")
# First step: using .*. for all interactions
f <- as.formula(y ~ .*.)
y <- data$y
# Second step: using model.matrix to take advantage of f
x <- model.matrix(f, data)[, -1]
glmnet(x, y)
f <- as.formula( ~ .^2)
也应该适用于包括主效应和所有成对的相互作用