1

在我们的模拟中,我们有一个基本的 2D 网格,闭合曲线(红线)可以在该网格上移动。网格单元根据其中心的位置被着色为曲线内部(绿色)或曲线外部(蓝色),并且每个状态变量(例如压力)可以具有不同的值。对于域中的任何给定点,我们可以准确地知道它是在内部还是外部,并且插值可以给出该点的特定状态(即,此信息比仅使用以单元为中心的笛卡尔网格更具体)。

网格的卡通

我们正在尝试对曲线内的“峰值”压力进行稳健的测量(例如,峰值可能是前 1% 值的平均值)。

目前,我们只取单元格中心值的最大值,但正如您在图像中看到的那样,每次曲线移动时,这都会给我们带来非常大的差异。我正在尝试评估不同的选项,但我不确定它们的有效性,特别是如果有我们可以使用的统计技术。

我们考虑过的选项:

  1. N*N*num_of_2D_cells在整个网格上随机抽取点样本
  2. 对于每个 2D 单元,随机抽取N*N点样本
  3. 将每个 2d 单元格细分为N*N更小的单元格并计算它们以单元格为中心的值

然而,随着N规模的扩大,这些方法应该会收敛,但是我们的 2D 网格可以有超过 1e7 个单元;因此,计算时间对大小设置了上限N

有没有人有经验——或者知道一组处理——这类问题的文献?

4

1 回答 1

0

问题陈述(从样本中了解前 1% 的基本人口的平均值)听起来与预测区间有关。我想这方面的任何具体问题最好在http://stats.stackexchange.com提出。

您是否知道压力值的分布,或者可能是某些边界,例如距离点之间的压力差x总是低于y,或类似的东西?这可以大大简化抽样方法。

就您提出的选项而言,您可以调整选项 #3 并使用四叉树来近似曲线的形状(使用 2d 单元格)。然后,您可以从(大约)曲线内的那些单元格中随机抽样,其频率与它们的面积成正比。这样做可以避免在不位于曲线内的区域中取样(这将是浪费精力),并且还可以避免进一步细分(几乎)完全包含在曲线中的单元格。最后,它应该为您提供来自(大约)曲线内的无偏随机样本,然后您可以在该样本上计算统计数据。

于 2013-04-16T12:12:03.107 回答