1

我需要对包含'n'自变量和因变量的数据执行线性插值。我目前scipy.interpolate.LinearNDInterpolator用于执行插值。但是,当我通过将(变量的)所有值乘以常数来更改数据集的范围时,插值后的结果会完全改变。

让我用一个具体的例子来说明这一点:

 X = [[0.00000000e+00, 1.00000000e+00], [0.00000000e+00, 8.00000000e+00], [0.00000000e+00, 1.60000000e+01], [0.00000000e+00, 3.20000000e+01], 
      [0.00000000e+00, 6.40000000e+01], [0.00000000e+00, 1.28000000e+02], [1.00000000e-06, 1.00000000e+00], [1.00000000e-06, 8.00000000e+00], 
      [1.00000000e-06, 1.60000000e+01], [1.00000000e-06, 3.20000000e+01], [1.00000000e-06, 6.40000000e+01], [1.00000000e-06, 1.28000000e+02], 
      [1.00000000e-06, 2.56000000e+02], [1.00000000e-06, 5.12000000e+02], [1.00000000e-05, 1.00000000e+00], [1.00000000e-05, 8.00000000e+00], 
      [1.00000000e-05, 1.60000000e+01], [1.00000000e-05, 3.20000000e+01], [1.00000000e-05, 6.40000000e+01], [1.00000000e-05, 1.28000000e+02], 
      [1.00000000e-05, 2.56000000e+02], [1.00000000e-05, 5.12000000e+02], [1.00000000e-04, 1.00000000e+00], [1.00000000e-04, 8.00000000e+00], 
      [1.00000000e-04, 1.60000000e+01], [1.00000000e-04, 3.20000000e+01], [1.00000000e-04, 6.40000000e+01], [1.00000000e-04, 1.28000000e+02], 
      [1.00000000e-04, 2.56000000e+02], [1.00000000e-04, 5.12000000e+02], [1.00000000e-03, 1.00000000e+00], [1.00000000e-03, 8.00000000e+00], 
      [1.00000000e-03, 1.60000000e+01], [1.00000000e-03, 3.20000000e+01], [1.00000000e-03, 6.40000000e+01], [1.00000000e-03, 1.28000000e+02], 
      [1.00000000e-02, 1.00000000e+00], [1.00000000e-02, 8.00000000e+00], [1.00000000e-02, 1.60000000e+01], [1.00000000e-02, 3.20000000e+01], 
      [1.00000000e-02, 6.40000000e+01], [1.00000000e-02, 1.28000000e+02]]
 y = [0.00000000e+00, 0.00000000e+00, 0.00000000e+00, 0.00000000e+00, 0.00000000e+00, 0.00000000e+00, 6.99000000e-17, 5.60000000e-16, 1.12011400e-15, 2.24034300e-15, 
      4.48080000e-15, 7.56193140e-14, 2.17896343e-13, 5.02450401e-13, 6.99000000e-16, 5.60000000e-15, 1.12011430e-14, 2.24034290e-14, 4.48080000e-14, 8.96171430e-14, 
      1.79235429e-13, 3.58472001e-13, 6.99000000e-15, 5.60000000e-14, 1.12011429e-13, 2.24034286e-13, 4.48080000e-13, 8.96171429e-13, 1.79235429e-12, 3.58472000e-12, 
      6.99000000e-14, 5.60000000e-13, 1.10000000e-12, 2.20000000e-12, 4.50000000e-12, 9.00000000e-12, 6.99000000e-13, 5.60000000e-12, 1.12000000e-11, 2.24000000e-11, 
      4.48000000e-11, 8.95000000e-11]

当我对值执行插值时,[7.10000000e-05, 18]我得到了结果7.95281146e-14。如果我将第一列乘以10^3结果列,10^12那么我得到的结果将完全不同。我得到0.09352相当于9.352e-14.

  • 有人可以解释一下为什么 scipy 在这些情况下会给出不同的结果吗?
  • 这些结果中哪一个是正确的?(我尝试使用 excel,但我很快意识到 scipy 使用了不同的技术)。
  • 我应该如何解决这个问题?
4

2 回答 2

2

正如上面罗伯特·克恩所说,答案是两个答案都是正确的。然而,他们回答不同的问题。

当在点 处插值分散数据时,(x, y)算法必须知道以下问题的答案:“哪些数据点最接近(x, y)。现在,显而易见的方法是,算法中使用的 Delaunay 三角剖分是基于, 是使用欧几里得距离:

distance = sqrt((x[i] - x)**2 + (y[i] - y)**2)

现在,如果您将 x 坐标按 1e3 缩放,“哪个点最接近”问题的答案显然会随着 y 坐标变得不那么重要而改变。

正确的选择是使用欧几里得距离有意义的比例。如果你在做物理,x 坐标和 y 坐标应该有相同的单位或者都是无量纲的。

于 2013-05-08T21:18:20.893 回答
1

这是机器精度的问题。坦率地说,你的 y - 值甚至超过了舍入误差的大小,这大约1.1e-16是双精度浮点数。

查看此参考以获得更好的解释每个计算机科学家都应该知道的关于浮点运算的知识

于 2013-05-07T09:08:09.913 回答