1

我正在构建和评估我的模型,如下所示。

yData <- rnorm(10)
xData <- matrix(rnorm(20), 10, 2)
polyModel <- lm(yData~polym(xData, degree=2, raw=T))
newData <- matrix(rnorm(100), 50, 2)
yPredicted <- predict(polyModel, polym(newData, degree=2, raw=T))

但是,模型评估yPredicted正好等于拟合值polyModel$fitted.values,一个长度为 10 的向量。在这种情况下,我期望yPredicted是一个长度为 50 的向量。一些帮助将不胜感激。

4

1 回答 1

1

predict()除非在data参数中指定数据,否则效果不佳。这似乎有效:

polyModel <- lm(yData~poly(V1, V2, degree=2, raw=TRUE),
                data=as.data.frame(xData))
length(fitted(polyModel))  ## 10
newData <- matrix(rnorm(100), 50, 2)
yPredicted <- predict(polyModel, newdata=as.data.frame(newData))
length(yPredicted) ## 50
  • V1并且V2是将矩阵转换为数据框时分配的默认列名。
  • 如果您将未知和/或大量列放入多项式(例如poly(V1, ..., V1000, degree=2, raw=TRUE)) ,则此规范将无法正常工作

如果您事先不知道列数,则稍微有点hacky 的解决方案是:

f <- as.formula(sprintf("yData~poly(%s, degree=2, raw=TRUE)",
           paste("V", seq(ncol(xData)), sep="", collapse=", "))
polyModel <- lm(f, data=as.frame(xData))

(未经测试)

于 2020-04-26T21:10:48.943 回答