r - svd() 与调用 svd、R 和 IML 的区别

Question

我正在将一个包从 R 翻译成 IML，完成后将在网上免费 :)。我从一个大矩阵的分解中得到了不同的结果，当你看它们时，这两个结果看起来是一样的，但是，例如，如果我取 U 的前 2 列并做 U'*U，我的 2x2 矩阵将完全不同（ U_11 = 1.1e-17 和 U_11 =1.4e-17)。差异非常小（3e-18），这让我认为这可能与每个软件使用的小数位数有关，SAS IML 和 R。有人对这个主题有更多了解吗？我该如何测试呢？谢谢你。

score 1 · Accepted Answer

在统计学中，我们将非常小的差异描述为“在统计上不显着”。对于数值分析师来说，小于“机器 epsilon”（R 中的 .Machine$double.eps 或 SAS 中的常量（“maceps”））的差异几乎总是“在数值上微不足道”。

SAS 和 R 都使用双精度计算，并且可能调用类似的数值库。对于这么小的差异，我推测原因不是算法，而是因为每个软件使用不同的编译器标志和优化标志。

即使在一个产品中，计算两个不同订单的结果也可能导致像这样的微小差异。例如，运行以下 DATA 步骤：

data _null_;
x = (1 + 1 + 1 + 1 + 1 + 1 + 1) / 7;
y = (1/7 + 1/7 + 1/7 + 1/7 + 1/7 + 1/7 + 1/7);
diff = x - y;
put diff=;
run;

我的建议是在比较不同的软件时忽略“数值上无关紧要”的结果。有关浮点计算的更多信息，请参阅浮点指南。有关真正的细节，请参阅“每个计算机科学家都应该了解的浮点运算知识”

r - svd() 与调用 svd、R 和 IML 的区别

1 回答 1

Related

Reference