我有一个包含 61 列(60 个解释变量和 1 个响应变量)的数据集。
所有的解释变量都是数字的,响应是分类的(默认)。一些前。变量具有负值(财务数据),因此标准化而不是标准化似乎更明智。但是,当使用“应用”函数进行标准化时,我必须先删除响应变量,所以我这样做:
模型 <- read.table ......
modelwithnoresponse <- model
modelwithnoresponse$Default <- NULL
means <- apply(modelwithnoresponse,2mean)
standarddeviations <- apply(modelwithnoresponse,2,sd)
modelSTAN <- scale(modelwithnoresponse,center=means,scale=standarddeviations)
到目前为止一切顺利,数据已标准化。但是,现在我想将响应变量添加回“modelSTAN”。我已经看过一些关于 dplyr、merge-functions 和 rbind 的帖子,但我不能完全开始工作,因此响应只会作为最后一列添加回我的“modelSTAN”。
有没有人对此有一个好的解决方案,或者可能是另一种解决方法来标准化它而不首先删除响应变量?
我对 R 很陌生,因为我是一名金融专业的学生,并将 R 作为选修课。