-1

该数据集有 252 个观测值和 18 个变量。我需要每十次观察的测试样本和剩余数据的训练样本,因此我创建了两个单独的数据集:

id <- seq(1, nrow(fat), by=10)
test  <- fat[id,]
train <-fat[id,]

我可以使用除brozekand之外的所有预测变量进行线性回归density

model2 <- lm(siri ~ .-brozek -density, train)

我需要做一个主成分回归模型

fatpca<-prcomp(fat[-id,]

但这仍然包括变量brozekdensity

我如何排除这些变量来做 PCR 模型?

4

1 回答 1

0

要删除几个变量,您有几个选择:

trainsub <- subset(train,select=-c(brozek,density))

或者

trainsub <- train[!colnames(train) %in% c("brozek","density"))

或者

trainsub <- dplyr::select(train,-c(brozek,density))

您还可以使用公式接口prcomp,即

prcomp(~ . -brozek - density, data=train)
于 2012-11-19T20:16:33.753 回答