3

我想对最好的 2 或 3 个库进行基准测试,以计算截断奇异值分解 (SVD),即仅保留 k 个最大奇异值的 SVD。此外,我有这些限制:

  • 它必须是一个java库
  • 我的矩阵是稀疏的(大约 1% 非零值)
  • 我的矩阵很大(通常是 10k x 5k)
  • 我的矩阵也可以大于高(5k x 10k)

我遇到了相当多的库,但例如,对于 Colt,我什至不知道 SVD 算法是否考虑到我的矩阵是稀疏的这一事实。此外,我没有找到可以直接计算截断解决方案的单个库(应该更快)。实际上,我最感兴趣的是从截断的 SVD 获得的近似矩阵。

提前感谢您的帮助,

罗曼·拉罗什

4

2 回答 2

4

我遇到了完全相同的问题,我的解决方案是:

  1. 在矩阵上使用Apache Commons Math运行 SVD
  2. 截断对角矩阵以仅保留前k个奇异值
  3. 截断其他两个矩阵,仅将前k列作为第一个矩阵,将前k行作为最后一个矩阵
  4. 将三个矩阵相乘

您获得的是原始矩阵的截断 SVD。

下面是完整的解决方案,使用具有数千行/列的矩阵进行测试。

public static double[][] getTruncatedSVD(double[][] matrix, final int k) {
    SingularValueDecomposition svd = new SingularValueDecomposition(new Array2DRowRealMatrix(matrix));

    double[][] truncatedU = new double[svd.getU().getRowDimension()][k];
    svd.getU().copySubMatrix(0, truncatedU.length - 1, 0, k - 1, truncatedU);

    double[][] truncatedS = new double[k][k];
    svd.getS().copySubMatrix(0, k - 1, 0, k - 1, truncatedS);

    double[][] truncatedVT = new double[k][svd.getVT().getColumnDimension()];
    svd.getVT().copySubMatrix(0, k - 1, 0, truncatedVT[0].length - 1, truncatedVT);

    RealMatrix approximatedSvdMatrix = (new Array2DRowRealMatrix(truncatedU)).multiply(new Array2DRowRealMatrix(truncatedS)).multiply(new Array2DRowRealMatrix(truncatedVT));

    return approximatedSvdMatrix.getData();
}
于 2014-04-15T13:27:28.967 回答
0

我使用了相当不错的http://math.nist.gov/javanumerics/jama/库。

于 2013-11-13T15:15:27.553 回答