我正在做无监督分类。为此,我有 8 个特征(绿色的方差、绿色的标准 div、红色的平均值、红色的方差、红色的标准 div、色调的平均值、色调的方差、色调的标准 div)进行分类每张图片,我想使用 PCA 选择 3 个最重要的特征。我为特征选择编写了以下代码(特征维度为:179X8):
for c=1:size(feature,1)
feature(c,:)=feature(c,:)-mean(feature)
end
DataCov=cov(feature); % covariance matrix
[PC,variance,explained] = pcacov(DataCov)
这给了我:
个人电脑 =
0.0038 -0.0114 0.0517 0.0593 0.0039 0.3998 0.9085 -0.0922
0.0755 -0.1275 0.6339 0.6824 -0.3241 -0.0377 -0.0641 0.0052
0.7008 0.7113 -0.0040 0.0496 -0.0207 0.0042 0.0012 0.0002
0.0007 -0.0012 0.0051 0.0101 0.0272 0.0288 0.0873 0.9953
0.0320 -0.0236 0.1521 0.2947 0.9416 -0.0142 -0.0289 -0.0266
0.7065 -0.6907 -0.1282 -0.0851 0.0060 0.0003 0.0010 -0.0001
0.0026 -0.0037 0.0632 -0.0446 0.0053 0.9125 -0.4015 0.0088
0.0543 -0.0006 0.7429 -0.6574 0.0838 -0.0705 0.0311 -0.0001
方差 =
0.0179
0.0008
0.0001
0.0000
0.0000
0.0000
0.0000
0.0000
解释 =
94.9471
4.1346
0.6616
0.2358
0.0204
0.0003
0.0002
0.0000
这意味着第一主成分解释了 94.9% 的方差,依此类推……但这些都是从最重要到最不重要的顺序。根据上述信息,我如何知道要选择哪些特征(从 1 到 8)。