我遇到了 PCA 分析,并注意到 R 中不同函数返回的不同值。这个问题的目的是消除每个输出的歧义。关于为什么这些函数返回不同的值,我没有找到令人满意的答案。比较的函数是:stats::princomp()
、stats::prcomp()
、psych::principal()
和FactoMineR::PCA()
。为了比较,对数据集进行了缩放和居中,并且全部设置为返回 4 个组件,但是为简洁起见,此处仅显示了前两台 PC。
下面是MWE
设置案例的代码。请随时报告 R 中的任何其他函数,您可能会发现在一个地方比较其输出可能会有所帮助,我希望。
princompPCA <- princomp(USArrests, cor = TRUE)
prcompPCA <- prcomp(USArrests,scale.=TRUE)
principalPCA <- principal(USArrests, nfactors=4 , scores=TRUE, rotate = "none",scale=TRUE)
library(FactoMineR)
fmrPCA <- PCA(USArrests, ncp=4, graph=FALSE) # vars scaled data
# now the first two PCs from each package into one data frame
dfComp <- cbind.data.frame(princompPCA$scores[,1:2],prcompPCA$x[,1:2],principalPCA$scores[,1:2],fmrPCA$ind$coord[,1:2])
names(dfComp) <- c("princompDim1","princompDim2","prcompDim1","prcompDim2","principalDim1","principalDim2","fmrDim1","fmrDim2")
head(dfComp)
输出:
princompDim1 princompDim2 prcompDim1 prcompDim2 principalDim1 principalDim2 fmrDim1 fmrDim2
Alabama -0.9855659 1.1333924 -0.9756604 1.1220012 0.61951483 -1.1277874 0.9855659 -1.1333924
Alaska -1.9501378 1.0732133 -1.9305379 1.0624269 1.22583308 -1.0679059 1.9501378 -1.0732133
Arizona -1.7631635 -0.7459568 -1.7454429 -0.7384595 1.10830334 0.7422678 1.7631635 0.7459568
Arkansas 0.1414203 1.1197968 0.1399989 1.1085423 -0.08889509 -1.1142591 -0.1414203 -1.1197968
California -2.5239801 -1.5429340 -2.4986128 -1.5274267 1.58654347 1.5353037 2.5239801 1.5429340
Colorado -1.5145629 -0.9875551 -1.4993407 -0.9776297 0.95203595 0.9826713 1.5145629 0.9875551
我注意到除了倒置符号之外的输出stats::princomp()
完全相同。FactoMineR::PCA()
知道为什么标志是镜像的吗?这两个函数的两个输出都接近,stats::prcomp()
但这可能是由于浮点问题,一个小问题。但psych::principal()
与其他人相对不同。可能是由于上述功能之间的旋转差异吗?因此,我们将不胜感激对这些差异的任何解释。