10

我正在使用 Python,并且已经使用本教程实现了 PCA 。

一切都很好,我得到了协方差,我做了一个成功的变换,把它带到原始尺寸没有问题。

但是我该如何进行美白呢?我尝试将特征向量除以特征值:

S, V = numpy.linalg.eig(cov)
V = V / S[:, numpy.newaxis]

并使用 V 来转换数据,但这会导致奇怪的数据值。有人可以对此有所了解吗?

4

4 回答 4

24

这是我从这里得到的一些用于矩阵白化的 Matlab 代码的 numpy 实现。

import numpy as np

def whiten(X,fudge=1E-18):

   # the matrix X should be observations-by-components

   # get the covariance matrix
   Xcov = np.dot(X.T,X)

   # eigenvalue decomposition of the covariance matrix
   d, V = np.linalg.eigh(Xcov)

   # a fudge factor can be used so that eigenvectors associated with
   # small eigenvalues do not get overamplified.
   D = np.diag(1. / np.sqrt(d+fudge))

   # whitening matrix
   W = np.dot(np.dot(V, D), V.T)

   # multiply by the whitening matrix
   X_white = np.dot(X, W)

   return X_white, W

您还可以使用 SVD 对矩阵进行白化:

def svd_whiten(X):

    U, s, Vt = np.linalg.svd(X, full_matrices=False)

    # U and Vt are the singular matrices, and s contains the singular values.
    # Since the rows of both U and Vt are orthonormal vectors, then U * Vt
    # will be white
    X_white = np.dot(U, Vt)

    return X_white

第二种方式有点慢,但可能在数值上更稳定。

于 2012-07-04T23:01:39.057 回答
13

如果您为此使用 python 的 scikit-learn 库,则只需设置内置参数

from sklearn.decomposition import PCA
pca = PCA(whiten=True)
whitened = pca.fit_transform(X)

检查文档

于 2016-06-28T12:55:14.947 回答
1

我认为你需要转置V并取S的平方根。所以公式是

matrix_to_multiply_with_data = transpose( v ) * s^(-1/2 )

于 2011-07-06T21:54:52.610 回答
0

改用 ZCA 映射

function [Xw] = whiten(X)
  % Compute and apply the ZCA mapping
  mu_X = mean(X, 1);
  X = bsxfun(@minus, X, mu_X);
  Xw = X / sqrtm(cov(X));
end 
于 2021-12-05T17:44:43.830 回答