该数据集有 252 个观测值和 18 个变量。我需要每十次观察的测试样本和剩余数据的训练样本,因此我创建了两个单独的数据集:
id <- seq(1, nrow(fat), by=10)
test <- fat[id,]
train <-fat[id,]
我可以使用除brozek
and之外的所有预测变量进行线性回归density
:
model2 <- lm(siri ~ .-brozek -density, train)
我需要做一个主成分回归模型
fatpca<-prcomp(fat[-id,]
但这仍然包括变量brozek
和density
。
我如何排除这些变量来做 PCR 模型?