我正在使用SimPy. 关于系统的问题之一是访客的等待时间分布是什么。我所做的是绘制我在模拟过程中获得的样本的标准化直方图。

这种分布不是纯粹连续的,我们有一个非零概率等待时间正好为零,因此在左端附近出现峰值。我希望它从图片中以某种方式显而易见,准确击中的实际概率是多少0。现在,峰值的高度不能正确显示,高度甚至高于 1(原因是许多点都在接近零的小段上)。
所以问题是这种分布的一般可视化技术,这些分布是连续和离散的混合。
我正在使用SimPy. 关于系统的问题之一是访客的等待时间分布是什么。我所做的是绘制我在模拟过程中获得的样本的标准化直方图。

这种分布不是纯粹连续的,我们有一个非零概率等待时间正好为零,因此在左端附近出现峰值。我希望它从图片中以某种方式显而易见,准确击中的实际概率是多少0。现在,峰值的高度不能正确显示,高度甚至高于 1(原因是许多点都在接近零的小段上)。
所以问题是这种分布的一般可视化技术,这些分布是连续和离散的混合。
(基于对 OP 的评论中的讨论)。
对于某个变量的分布,称为它t,作为离散和连续分量的混合,我将 pdf 编写为一组 delta-peaks 和一个连续部分的总和,
p(t) = \sum_{a} p_a \delta(t-t_a) + f(t)
其中a枚举离散值t_a,p_a是 的概率t_a,f(t)是分布的连续部分的 pdf,因此是属于f(t)dt的概率。t[t,t+dt)
请注意,整个事情是标准化的,\int p(t) =1其中积分超过了 的适当范围t。
现在,为了可视化这一点,我将分离离散组件,并将它们绘制为离散值(作为窄箱或作为带有下降线的点等)。然后对于其余部分,我将使用直方图,您可以从上面的等式中知道正确的归一化:直方图下的面积总和应为1-\sum_a p_a.
我并没有声称这是方式,这正是我会做的。