我在解释结果时遇到了一些问题prcomp()
。
假设我有一个名为 dat 的居中和缩放的 data.table,有 N 列和 M 行。事实上,每一列代表一个特征,每一行代表一个记录。我还得到了一个 M 维的结果向量Y
。
我想知道这个系统的 PCA 是怎么说的。所以我刚刚执行:
dat.pca=prcomp(dat,retx=TRUE)
通过肘部方法,我决定保留 5 个 PCA 模式,占方差的 90%。然后,我得到以下信息data.table
:
dat.pcadata=as.data.table(dat.pca$x)
dat.pcadata
有M行N列,每列对应一个PCA模式。
我的问题是:如果我说现在应该训练我的系统使用dat.pcadata
as 特征的前 5 列来预测结果 Y,我是否理解正确?