我想从一个分布中抽取 N 个随机样本,该分布是两个截断的正态分布之和。rv_continuous
我通过子类化并提供一个 pdf 来获得我想要的东西scipy.stats
,该 pdf 是两个给定 pdf 的平均值:
import numpy as np
from scipy import stats
my_lim = [0.05, 7] # lower and upper limit
my_loc = [1.2, 3] # loc values of the two truncated normal distributions
my_scale = [0.6, 2] # scale values of the two truncated normal distributions
class sum_truncnorm(stats.rv_continuous):
def _pdf(self, x):
return (stats.truncnorm.pdf(x,
a=(my_lim[0] - my_loc[0]) / my_scale[0],
b=(my_lim[1] - my_loc[0]) / my_scale[0],
loc=my_loc[0],
scale=my_scale[0]) +
stats.truncnorm.pdf(x,
a=(my_lim[0] - my_loc[1]) / my_scale[1],
b=(my_lim[1] - my_loc[1]) / my_scale[1],
loc=my_loc[1],
scale=my_scale[1]) / 2
但是,使用:
my_dist = sum_truncnorm()
my_rvs = my_dist.rvs(size=10)
非常慢,每个随机值大约需要 5 秒。
我确信这可以更快地完成,但我不知道该怎么做。我是否应该将我的分布定义为(非截断)正态分布的总和,然后强制截断?我在这个方向上做了一些测试,但这只是快了大约 10 倍,因此仍然很慢。
谷歌告诉我,我可能需要使用逆变换采样并覆盖该_rvs
方法,但我未能使其适用于我的截断分布。