1

我正在尝试对我的数据集实施内核 PCA,该数据集具有分类(用一个热编码器编码)和数字特征,并将维度的数量从 22 维减少到 3 维。之后,我将继续集群实现。我使用 Spyder 作为 IDE。为了从算法中了解我生成的集群的结构,我想解释哪些特征影响派生的主成分以及它们如何影响它们。可能吗?如果是这样,我该如何解释,有什么方法吗?

4

1 回答 1

0

由于您在内核空间中应用 PCA,因此与您的原始特征和缩减数据的特征之间存在严格的非线性关系;您计算的特征向量一开始就在内核空间中。这阻碍了直接的方法,但也许您可以进行某种敏感性分析。对原始特征应用小扰动,并测量最终的、减少的特征对它们的反应。最终特征相对于原始特征的雅可比也是一个很好的起点。

于 2018-06-01T14:16:39.983 回答