-1

我有一个数据集,其列为

x1 x2 x3 x4 x5 是

它们都具有整数/浮点值,Y 值范围从 98,000 到 1,10,000

如果我想找到 x1 和 y 、 x2 和 y ... x5 和 y 之间的关系并想出

y = A.x1+c

我该怎么做?

我尝试绘制图形,还尝试了 R 中的 lm() 和 fit() 函数。

fit <- lm(Y~X1+X2+X3+X4+X5,data=data)
step <- stepAIC(fit, direction="both")

请帮忙。

4

1 回答 1

0

y我认为它应该使用一些特殊的包来找到和 variable之间的最佳线性/关系xi。你可以看到例如leaps包。

您还可以通过遍历所有 xi 来找到关系。这是一种方法。最重要的是,我将您的代码扭曲到一个函数中。我使用dot formula符号。

lm_col <-
  function(var,data){
    fit <- lm(y~.,subset(data,select=c('y',var)))
    stepAIC(fit, direction="both")
  }

然后你使用循环遍历所有变量lapply

 lapply(paste0('x',seq(5)),lm_col,data=dat)

您可以使用以下数据对此进行测试:

dat <- as.data.frame(matrix(rnorm(6*10),ncol=6))
colnames(dat) <- c(paste0('x',seq(5)),'y')

但正如我一开始所说,我认为这不是做你想做的事情的最好方法(不是很清楚)从统计学上讲。

于 2014-05-17T11:38:09.637 回答