概述:我是 ML 和学习 sklearn 预处理的新手。我发现当我们对 TEST 数据使用 sklearn 预处理转换时,mean 不会为 0,std 不会为 1(原因是我们使用 TRAIN 数据 mean/std 来标准化测试数据)。
我的问题:如果测试数据以这种方式标准化(未正确标准化为均值为 0 和标准为 1 的高斯正态分布),那么这会影响 ML 算法的预测吗?我的理解是,ML 预测的准确性会很低,因为我们给 ML 模型提供了不正确的标准化数据。
概述:我是 ML 和学习 sklearn 预处理的新手。我发现当我们对 TEST 数据使用 sklearn 预处理转换时,mean 不会为 0,std 不会为 1(原因是我们使用 TRAIN 数据 mean/std 来标准化测试数据)。
我的问题:如果测试数据以这种方式标准化(未正确标准化为均值为 0 和标准为 1 的高斯正态分布),那么这会影响 ML 算法的预测吗?我的理解是,ML 预测的准确性会很低,因为我们给 ML 模型提供了不正确的标准化数据。