我正在使用SimPy
. 关于系统的问题之一是访客的等待时间分布是什么。我所做的是绘制我在模拟过程中获得的样本的标准化直方图。
这种分布不是纯粹连续的,我们有一个非零概率等待时间正好为零,因此在左端附近出现峰值。我希望它从图片中以某种方式显而易见,准确击中的实际概率是多少0
。现在,峰值的高度不能正确显示,高度甚至高于 1(原因是许多点都在接近零的小段上)。
所以问题是这种分布的一般可视化技术,这些分布是连续和离散的混合。
我正在使用SimPy
. 关于系统的问题之一是访客的等待时间分布是什么。我所做的是绘制我在模拟过程中获得的样本的标准化直方图。
这种分布不是纯粹连续的,我们有一个非零概率等待时间正好为零,因此在左端附近出现峰值。我希望它从图片中以某种方式显而易见,准确击中的实际概率是多少0
。现在,峰值的高度不能正确显示,高度甚至高于 1(原因是许多点都在接近零的小段上)。
所以问题是这种分布的一般可视化技术,这些分布是连续和离散的混合。
(基于对 OP 的评论中的讨论)。
对于某个变量的分布,称为它t
,作为离散和连续分量的混合,我将 pdf 编写为一组 delta-peaks 和一个连续部分的总和,
p(t) = \sum_{a} p_a \delta(t-t_a) + f(t)
其中a
枚举离散值t_a
,p_a
是 的概率t_a
,f(t)
是分布的连续部分的 pdf,因此是属于f(t)dt
的概率。t
[t,t+dt)
请注意,整个事情是标准化的,\int p(t) =1
其中积分超过了 的适当范围t
。
现在,为了可视化这一点,我将分离离散组件,并将它们绘制为离散值(作为窄箱或作为带有下降线的点等)。然后对于其余部分,我将使用直方图,您可以从上面的等式中知道正确的归一化:直方图下的面积总和应为1-\sum_a p_a
.
我并没有声称这是方式,这正是我会做的。