5

我在网上遇到了许多类似的问题,但找不到能解决我能理解的问题的问题。我会很感激这里的一些解释,以帮助我理解。提前致谢!

所以,

[COEFF,SCORE,latent,tsquare] = princomp(X)

我知道对于coeff,各列按分量方差递减的顺序排列。但是我是否知道我的变量(原始数据集)的重要性,而不是主成分(PC)的重要性,正如答案coeff可能出现的那样。有没有办法对我拥有的变量的重要性进行排名?

我看到许多统计软件都能够做到这一点,显示哪些原始变量对绘图的贡献最大,哪些可以删除以防止过度拟合问题。有没有办法用 MatLab 做到这一点?

我的目标是在 2D 图中绘制数据,这意味着我将使用 PC1 和 PC2,它们具有最显着的分量方差。再说一遍,我怎么知道哪些变量应该保留,哪些应该丢弃?

谁能给我解释一下?谢谢!

4

1 回答 1

2

如果您只关心将数据投影到 2D 平面以进行可视化,那么请务必从中获取每个点的前两个坐标SCORE- 这些是您在问题中提到的PC1坐标PC2

但是,如果您想知道哪个是贡献最大的两个组件X您必须在前两列中找到具有最大绝对值的条目。由于 的前两列表示产生和的元素的线性组合。PC1PC2COEFFCOEFFXPC1PC2

于 2013-01-21T06:09:39.580 回答