1

我有一个数据集,我分成了一个训练集和一个测试集。这意味着当我对它们进行缩放时,我应该将数据值缩放到训练集,然后使用相同的比例缩放测试集。特别是,我只想缩放这两组中的 2 列。

在 Python 中,我可以使用缩放类来做到这一点——我只调用fit_transform训练集,然后只调用transform测试集。但在 R 中,我不确定最简单的方法。training_set[, 2:3] = scale(training_set[, 2:3])我可以使用(因为我只想缩放第二列和第三列)将训练集缩放到自身。但是我怎样才能将测试集扩展到同样的规模呢?

抱歉,如果之前有人问过这个问题,我对 R 和 Python 都很陌生,可能缺少一些术语来找到我真正想要的东西。

4

1 回答 1

0

一个不像@JacobJacox 的解决方案那样通用的快速版本将是

test_set[,2] = (test_set[,2] - mean(training_set[,2])) / sd(training_set[,2])
test_set[,3] = (test_set[,3] - mean(training_set[,3])) / sd(training_set[,3])
于 2018-12-19T14:02:11.257 回答