我正在尝试在 WEKA(分类问题)中进行 PCA 降维。
我的数据中有 200 个属性,接近 2100 行。
这是我遵循的步骤
在 WEKA 资源管理器中导入 csv 文件
在预处理选项卡中,应用,规范化数据(将整个数据置于 [0,1] 范围内
然后实施 PCA。
- 在 PCA 的选项中,centerData 有一个选项,如果设置为 False,将在标准化数据后使用相关矩阵进行计算(如果我错了,请纠正我),如果设置为 true,将使用协方差矩阵。
我的疑问是
- 我是否应该在实施 PCA 之前对数据进行规范化?我尝试在规范化之前和之后这样做,我得到了不同的结果。所以我很困惑。
- 我应该标准化数据(将均值设为 0)然后应用 PCA。
在这两种情况下,我应该在 PCA WEKA 中为 centerData 选项选择什么选项?