10

对于这个有点混乱的标题,我很抱歉,但我不确定如何更清楚地总结这一点。

我有两组 X、Y 数据,每组对应一个总体的总体值。它们是从原始数据中相当密集地采样的。我正在寻找的是一种为任何给定 Y 找到插值 X 的方法,该值介于我已经拥有的集合之间。

这张图更清楚地说明了这一点:

点图

在这种情况下,红线来自对应于 100 的集合,黄线来自对应于 50 的集合。

我想说,假设这些集合对应于值的梯度(即使它们显然是由离散的 X、Y 测量值组成),我如何找到,比如说,如果 Y 是 500,X 会在哪里对于对应于值 75 的集合?

在此处的示例中,我希望我想要的点在此处附近:

带有插值点的点图

我不需要这个函数过于花哨——它可以是数据点的简单线性插值。我只是想不通。

请注意,这两组的 X 和 Y 都不是完全重叠的。然而,说“这些集合共享的最近的 X 点在哪里”或“这些集合共享的最近的 Y 点在哪里”是相当微不足道的。

我在已知值之间使用了简单的插值(例如,为集合“50”和“100”找到对应 Ys 的 X,然后平均得到“75”),我最终得到如下所示的结果:

不是很好的插值

很明显我在这里做错了什么。显然,在这种情况下,对于所有那些 Y 高于“最低”集合的最大 Y 的情况,X (正确地)返回为 0。事情开始很好,但是当一个人开始接近最低设置的最大 Y 时,它开始变得混乱。

很容易看出为什么我的出错了。这是看待问题的另一种方式:

插图

在“正确”版本中,X 应该是 250 左右。相反,我所做的基本上是平均 400 和 0,所以 X 是 200。在这种情况下,我该如何求解 X?我在想双线性插值可能是答案,但我无法找到任何东西来说明我将如何处理这类事情,因为它们似乎都是针对不同的问题而构建的。

感谢您的帮助。请注意,虽然我显然已经在 R 中绘制了上述数据以便于查看我在说什么,但最终的工作是在 Javascript 和 PHP 中。我不是在寻找重任;简单更好。

4

1 回答 1

11

楼主,我终于想通了。这是最终结果:

最终产品

美丽的!但工作量很大。

我的代码过于复杂,对我的项目来说太具体了,对其他人没有多大用处。但这是基本逻辑。

您必须有两组数据进行插值。我称这些为“外”曲线和“内”曲线。假设“外部”曲线完全包含“内部”曲线,而不与“内部”曲线相交。曲线实际上只是 X、Y 数据的集合,并且对应于定义为 Z 的一组值。在此处使用的示例中,“外部”曲线对应于 Z = 50,“内部”曲线对应于 Z = 100 .

重申一下,目标是为任何给定的 Y 找到 X,其中 Z 是我们已知数据点之间的某个数字。

  1. 首先计算未知 Z 代表的两个曲线集之间的百分比。因此,如果在我们的示例中 Z=75,则结果为 0.5。如果 Z = 60,则为 0.2。如果 Z = 90,则为 0.8。称这个比例为 P。

  2. 选择“外部”曲线上的数据点,其中 Y = 您想要的 Y。想象一下该点和 0,0 之间的线段。将其定义为 AB。

  3. 我们想找到 AB 与“内部”曲线相交的位置。为此,我们遍历内部曲线上的每个点。将所选点与点+1 之间的线段定义为 CD。检查 AB 和 CD 是否相交。如果没有,请继续迭代,直到他们这样做。

  4. 当我们找到 AB-CD 交点时,我们现在查看由交点创建的线和我们在步骤 2 中的“外”曲线上的原点。那么,这条线段是内曲线和外曲线之间的线,其中线的斜率,如果它继续“向下”图表,将与 0,0 相交。将此新线段定义为 EF。

  5. 找到 EF 长度的 P 百分比(来自步骤 1)的位置。检查 Y 值。是我们想要的 Y 值吗?如果是(不太可能),则返回该点的 X。如果不是,请查看 Y 是否小于目标 Y。如果是,则将该点的位置存储在一个变量中,我将其命名为 lowY。然后再次返回第 2 步,寻找外曲线上的下一个点。如果它大于目标 Y,则查看 lowY 中是否有值。如果是,则在两个值之间进行插值并返回插值后的 X。(换句话说,我们已经“装箱”了我们想要的坐标。)

上述过程效果很好。在 Y=0 的情况下它会失败,但很容易做到这一点,因为你可以对这两个特定点进行插值。在样本数量少得多的地方,它会产生锯齿状的结果,但我想这是可以预料的(这些是 Z = 5000,6000,7000,8000,9000,10000,其中只有 5000 和 10000 是已知点它们每个只有 20 个数据点——其余的都是插值的):

锯齿状的结果

我并没有声称这是一个优化的解决方案,但是在我的计算机上解决大量点实际上是即时的,所以我认为对于现代机器来说它并不太费力,至少对于我拥有的总点数(30-每条曲线 50 个)。

感谢大家的帮助;通过一点讨论这个问题并意识到我在这里真正想要的不是任何简单的线性插值,而是一种沿曲线的“径向”插值,这很有帮助。

于 2013-12-10T19:35:26.220 回答