0

我正在经历我认为使用numpy具有较大值的叉积的奇怪行为。

例如,以下似乎是正确的:

r = 1e15
a = array([1, 2, 3]) * r;
b = array([-1, 2, 1]) * r;

c = cross(a / norm(a), b / norm(b));

print(dot(c, a))  # outputs 0.0

但是如果我们将指数提高 1,我们得到:

r = 1e16
a = array([1, 2, 3]) * r;
b = array([-1, 2, 1]) * r;

c = cross(a / norm(a), b / norm(b));

print(dot(c, a))  # outputs 2.0

对于较大的指数值,数字变得更加奇怪。有谁知道这里发生了什么?谢谢!

4

1 回答 1

2

您会看到舍入错误。默认情况下,array()返回一个带有dtype=float64. 随着您r越来越大,您将用完尾数空间来准确表示数组产品。这是一种测试方法:

def testcross(r, dt):
    a = array([1, 2, 3], dtype=dt)*r
    b = array([-1, 2, 1], dtype=dt)*r
    c = cross(a/norm(a), b/norm(b))
    return dot(c, a)

for rr in logspace(4, 15, 10):
    print "%10.2f %10.2f %g" % (testcross(rr, float32), testcross(rr, float64)

结果:

     -0.00       0.00 10000
      0.00      -0.00 166810
      0.00       0.00 2.78256e+06
     -4.00       0.00 4.64159e+07
    -64.00       0.00 7.74264e+08
   1024.00       0.00 1.29155e+10
      0.00       0.00 2.15443e+11
-524288.00       0.00 3.59381e+12
      0.00      -0.02 5.99484e+13
-134217728.00       0.00 1e+15

float64请注意,即使对于with ,事情也不是“完美的” r=5.99484e13。这表明精度在你到达之前很久就开始崩溃了r=1e15,即使是float64. 正如预期的那样,使用不太精确的float32.

遵循 OP 的建议:32 位和 64 位浮点表示的尾数字段分别为 24 位和 53 位(包括隐含位)。取log10([2**24, 2**53]),我们看到这分别对应于大约 7 和 16 个数量级。这与最初指出的出现在表格中的错误相对应r=4.6e7。当点积导致基础矩阵计算减去大数时会发生舍入,并且差异不能用一个或另一个大数的尾数表示。float32r=1e16

于 2016-06-03T01:13:27.127 回答