我正在尝试将线性判别分析应用于二分类问题。据我了解,LDA 假设两个类具有相同的协方差矩阵,然后将似然性建模为具有不同均值的高斯分布。
我尝试过的另一个分类器是朴素贝叶斯。它忽略了预测变量之间的任何相关性。
现在,我不明白将 PCA 应用于数据集时会发生什么。根据其定义,PCA 算法旋转数据使得协方差矩阵是对角线。旋转没有丢失任何东西,但是由于协方差矩阵现在是对角的,朴素贝叶斯不应该和 LDA 一样好,甚至更好,因为 LDA 将有更多的参数来估计?然而,根据我的数据,无论有没有 PCA,LDA 的表现都优于朴素贝叶斯。
确实,只要我使用了所有的主成分,数据是完全一样的,这告诉我结果确实应该是这样的。然而协方差矩阵是对角线的......大脑崩溃
有人可以向我解释一下吗?我希望我已经足够清楚地表达了我的问题。谢谢!