我想知道如何声称我正确地捕捉到了数据中的“噪音”?
更具体地说,以主成分分析为例,我们知道在 PCA 中,在做 SVD 之后,我们可以将小的奇异值归零,并使用低秩逼近重构原始矩阵。
那么我可以声称被忽略的确实是数据中的噪音吗?是否有任何评估指标?
我能想出的唯一方法就是从重建数据中减去原始数据。
然后,尝试在其上拟合高斯,看看适应度是否良好。
是像DSP这样的传统方法吗?
顺便说一句,我认为在典型的机器学习任务中,测量将是后续分类性能,但由于我正在做纯粹的生成模型,因此没有附加标签。