numpy - 从给定的二维分布函数中抽取随机数据

Question

我有一个理论分布，我想在 2D 空间中随机抽样以得到以下分布：

def p(z,m):
    E = { 'ft':0.55, 'alpha': 2.99, 'z0':0.191, 'km':0.089, 'kt':0.25 }
    S = { 'ft':0.39, 'alpha': 2.15, 'z0':0.121, 'km':0.093, 'kt':-0.175 }
    I={ 'ft':0.06, 'alpha': 1.77, 'z0':0.045, 'km':0.096, 'kt':0.0 }
    Evalue=E['ft']*np.exp(-1*E['kt']*(m-20))*z**E['alpha']*np.exp(-1*(z/(E['z0']+E['km']*(m-20)))**E['alpha'])
    Svalue=S['ft']*np.exp(-1*S['kt']*(m-20))*z**S['alpha']*np.exp(-1*(z/(S['z0']+S['km']*(m-20)))**S['alpha'])
    Ivalue=I['ft']*np.exp(-1*I['kt']*(m-20))*z**I['alpha']*np.exp(-1*(z/(I['z0']+I['km']*(m-20)))**I['alpha'])
    value=Evalue+Svalue+Ivalue
    return value

更新：我发现逆变换采样是从概率分布中采样数据的合适方法。我如何在 python 中为 2D 数据编写这个方法，或者有没有我可以使用的库？

score 1 · Accepted Answer

看看马尔可夫链蒙特卡罗（MCMC）方法。基本上你在 (z, m) 点的空间中跳跃。无论你在哪里，你总是接受增加 p(z, m) 的跳跃。你接受一个以一定概率减小 p(z, m) 的跳跃。有一个 Python 库 PyMC 可以执行该过程。

score -1 · Accepted Answer

如果您想从 p(z,m) 中随机采样一个值，那么实现这一点的一种简单方法是使用 python 中的“随机”模块。我使用 numpy 的随机版本来展示这个想法：

import numpy as np
import matplotlib.pyplot as plt

def p(z,m):
    E = { 'ft':0.55, 'alpha': 2.99, 'z0':0.191, 'km':0.089, 'kt':0.25 }
    S = { 'ft':0.39, 'alpha': 2.15, 'z0':0.121, 'km':0.093, 'kt':-0.175 }
    I={ 'ft':0.06, 'alpha': 1.77, 'z0':0.045, 'km':0.096, 'kt':0.0 }
    Evalue=E['ft']*np.exp(-1*E['kt']*(m-20))*z**E['alpha']*np.exp(-1*(z/(E['z0']+E['km']*(m-20)))**E['alpha'])
    Svalue=S['ft']*np.exp(-1*S['kt']*(m-20))*z**S['alpha']*np.exp(-1*(z/(S['z0']+S['km']*(m-20)))**S['alpha'])
    Ivalue=I['ft']*np.exp(-1*I['kt']*(m-20))*z**I['alpha']*np.exp(-1*(z/(I['z0']+I['km']*(m-20)))**I['alpha'])
    value=Evalue+Svalue+Ivalue
    return value

# Define the number of iterations you want for each variable    
num_iter_m = 50
num_iter_z = 50

# I then set rand_m to go from 20 to 30, as your function fails for <20
rand_m = (np.random.random(num_iter_m)*10)+20

# z goes from the range 0 - 1
rand_z = (np.random.random(num_iter_z))

# Note, I am sampling from a uniform distribution for m and z. You can use more complicated functions, i.e., Gaussian/Normal shapes or even user defined.

rand_p = np.zeros((len(rand_z), len(rand_m)))

# Fill a grid with the random p(z,m) values
for i in range(len(rand_z)):
  for j in range(len(rand_m)):
    rand_p[i][j] = p(rand_z[i], rand_m[j])

# Plot
fig = plt.figure(0)

ax1 = fig.add_subplot(211)
ax1.scatter(rand_z, rand_m)
ax1.set_xlabel("z")
ax1.set_ylabel("m")

ax2 = fig.add_subplot(212)
cf = ax2.contourf(rand_z, rand_m, rand_p)
ax2.set_xlabel("z")
ax2.set_ylabel("m")

colbar = plt.colorbar(cf)
colbar.set_label("p(z,m)")

plt.show()

示例图像

以更复杂的方式使用它的特定模块是，例如 PyMC ( https://github.com/pymc-devs/pymc ) 或 emcee ( http://dan.iel.fm/emcee/current/）。

如果您想对由二维函数 p(z,m) 加权的 z 和 m 进行采样，这会稍微复杂一些。

numpy - 从给定的二维分布函数中抽取随机数据

2 回答 2

Related

Reference