我在网上遇到了许多类似的问题,但找不到能解决我能理解的问题的问题。我会很感激这里的一些解释,以帮助我理解。提前致谢!
所以,
[COEFF,SCORE,latent,tsquare] = princomp(X)
我知道对于coeff
,各列按分量方差递减的顺序排列。但是我是否知道我的变量(原始数据集)的重要性,而不是主成分(PC)的重要性,正如答案coeff
可能出现的那样。有没有办法对我拥有的变量的重要性进行排名?
我看到许多统计软件都能够做到这一点,显示哪些原始变量对绘图的贡献最大,哪些可以删除以防止过度拟合问题。有没有办法用 MatLab 做到这一点?
我的目标是在 2D 图中绘制数据,这意味着我将使用 PC1 和 PC2,它们具有最显着的分量方差。再说一遍,我怎么知道哪些变量应该保留,哪些应该丢弃?
谁能给我解释一下?谢谢!