0

我正在尝试对多元时间序列数据进行分类。我想对这种数据进行特征缩放。假设多元时间序列数据如下所示:

F1                             F2                              F3                             
[1.0 2.0 3.0 4.0........]    [41.0 23.0 3.0 4.0.........]    [103.0 27.0 3.0 43.0.......]        
[331.0 2.0 3.0 4.0......]    [41.0 23.0 3.50 444.0......]    [1333.0 27.0 3.0 43.0......]        

等等,

我应该如何使用此处的特征缩放将所有特征置于同一范围内?

方法一: 1.对F1中的每个list计算均值和标准差,对数据进行标准化 2.对所有特征中的所有list(F2,F3)重复上述步骤

方法二: 1、计算F1中每个列表的均值,然后计算所有列表的均值,同样计算每个列表的std,对F1中所有列表求平均值。使用这个平均值和标准差来标准化特征 F1 2. 对所有其他特征(F2,F3)重复上述步骤

标准化此类数据的正确方法是什么?上述方法是否正确?

4

1 回答 1

1

正如你在这里看到的,标准化的公式是:

z = (x-x')/S, where x is a point, x' is the sample mean and S is the stdev of the sample.

这意味着x'应该是列中所有列表的平均值(例如 F1),并且S应该是列中所有列表的标准差。然后这个计算z应该应用于每个点。

标准化此类数据的正确方法是什么?上述方法是否正确?

方法 1 不是一个好方法,因为列表 1 的平均值与列表 2 的平均值不同,并且由于它们是同一样本的一部分,因此居中平均值应该相同。方法 2 在均值计算中是可以的,但我不确定在标准差的计算中。一起计算所有列表的标准差绝对是正确的。

于 2020-02-06T16:46:01.810 回答