8

我有一个需要通过随机采样重新创建的 2D“热图”或 PDF。IE 我有一个显示起始位置的二维概率密度图。我需要随机选择与原始 PDF 具有相同概率的起始位置。

为此,我想我需要先找到联合 CDF(累积密度函数),然后选择随机均匀数对 CDF 进行采样。这就是我卡住的地方。

如何以数字方式找到我的 PDF 的联合 CDF?我尝试在两个维度上进行累积求和,但这并没有产生正确的结果。我的统计知识让我失望了。

编辑热图/PDF 是 [x,y,z] 的形式,其中 Z 是每个 x,y 点的强度或概率。

4

4 回答 4

3

您可以首先查看 2D 密度图,并为其中的每个 (x,y) 对,通过从 PDF 中查找来找到 z。这将为您提供一个概率为 z 的起点 (x,y)。所以每个起点都有自己的PDF概率。你现在可以做的,是对起点进行排序,随机选择一个数字并将其映射到某个起点。

例如,假设您有 n 个起点:P1 .. Pn。概率为 p1 .. pn(归一化或加权概率,因此总和为 100%)。假设您选择一个随机值 p,如果 p < p1 则选择 P1,如果 p1 < p < p1+p2 则选择 P2,如果 p1+p2 < p < p1+p2+p3 则选择 P3 等等。您可以将其视为点 P1 到 PN 上的直方图,这与累积分布函数相同。

于 2011-05-26T22:55:36.107 回答
1

吉布斯采样应该给你你想要的

http://en.wikipedia.org/wiki/Gibbs_sampling

于 2011-05-26T22:06:19.857 回答
1

好吧,正如在这个答案中所观察到的那样,就我而言,我的分布是双变量的并不一定重要。由于我可以对整个事物进行归一化,使其成为真正的 pdf(总表面积分为 1),因此我可以将 MxN 矩阵重新排列为 1xM*N 向量。一旦我有了它,我就可以做一个累积积分(MATLAB 中的 cumtrapz),然后从中采样(使用一个统一的随机数来找到相应的索引值)。

于 2011-05-26T22:24:33.317 回答
1

这也是我想做的!!

我有一个独立变量 X 和 Y 的联合密度函数。我现在想从这个分布中采样新的 x,y。

我相信我必须做的是找到联合累积分布,然后以某种方式从中采样。这正是你似乎所做的。

当您说您使用“统一随机数来查找相应的索引值”时,您能否更具体一些?

仅供参考:X 是卖单的大小,Y 是股票市场的买单大小。

于 2012-04-17T12:16:15.540 回答