如何标准化具有特定均值和标准差值的数据集?
我知道存在类似的包,sklearn.preprocessing.StandardScaler
但这个包只允许我们使用数据集自己的平均值和标准差值来标准化数据集。如果我想使用自己指定的均值和标准差值对数据集进行标准化怎么办?
我可以使用 Python 中的包吗?否则,我能想到的一种方法是为每个特征手动执行此操作(即(X-mean)/(stddev)
,对于数据集中的每个特征,其中mean
=我自己指定的平均值,stddev
=我自己指定的标准偏差值)。
提前致谢。