数据集如下所示:
- 除了(目前与年份一起索引)之外,所有特征
x
都是数字和缩放的name
[name, year, x1, x2, x3, x4, ...]
josh 2001 ... #the various values for the x_features, for that name, at that time
josh 2002 ...
josh 2003 ...
bill 2001 ...
bill 2002 ...
bill 2003 ...
我已经应用于StandardScaler
我的整个时间序列数据集。
我现在即将使用
PCA
,但我停下来想知道它是否可以/应该应用于像上面那样的整个时间序列数据集。
- 我刚刚完成了对 PCA 的大量研究,但想不出在时间序列上使用它会有什么不同的原因。
- 我是否忘记了关于时间序列的 PCA 的一些重要内容?
我发现了一些较早提到的功能性 PCA,但这仍然相关/需要吗?还是 SciKit.learn 已经过时了?