我有一个包含这些值的数据框 dummy vales,我想对它们进行 lm 回归。其中一个变量是分组的连续变量,如下所示
df <- data.frame("y" = c(10, 11, 12, 13, 14),
"x" = as.factor(c("100-102", "103-105", "106-108", "109-111", "112-114")))
我想回归 y~x,一种方法是用它们的平均数值替换 x 因子。使用正则表达式很容易做到这一点。
另一种方法是创建额外的行并扩展您的数据集,使其看起来像这样
data.frame("y" = c(10, 10, 10, 11, 11, 11......),
"x" = c(100, 101, 102, 103, 104, 105......))
有没有可以做到这一点的功能?
我正在考虑首先创建额外的变量,如 x1、x2、x3,然后使用 reshape2 包将 x 列转换为行。