我从有人说的帖子中读到它:
对于特征缩放,您了解训练集的均值和标准差,然后:
- 使用训练集均值和标准差对训练集进行标准化。
- 使用训练集均值和标准差对任何测试集进行标准化。
但是现在我的问题是,在使用缩放的训练数据拟合模型之后,我应该将这个拟合模型应用于缩放的或未缩放的测试数据吗?谢谢!
我从有人说的帖子中读到它:
对于特征缩放,您了解训练集的均值和标准差,然后:
但是现在我的问题是,在使用缩放的训练数据拟合模型之后,我应该将这个拟合模型应用于缩放的或未缩放的测试数据吗?谢谢!
是的,您还应该缩放测试数据。如果您已经缩放了训练数据并为该缩放数据拟合了模型,那么测试集也应该进行等效的预处理。这是标准做法,因为它确保始终为模型提供形式一致的数据集作为输入。
在 Python 中,该过程可能如下所示:
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)
在您可能感兴趣的另一个线程上对此主题有详细的描述。