我无法将直方图绘制为 pdf(概率)
我希望所有部分的总和等于一个区域,以便更容易跨数据集进行比较。出于某种原因,每当我指定中断(默认值为 4 或其他任何糟糕的值)时,它不再希望将 bin 绘制为概率,而是将 bin 绘制为频率计数。
hist(data[,1], freq = FALSE, xlim = c(-1,1), breaks = 800)
我应该把这条线改成什么?我需要一个概率分布和大量的垃圾箱。(我有 600 万个数据点)
这是在 R 帮助中,但我不知道如何覆盖它:
频率逻辑; 如果 TRUE,直方图图形是频率的表示,结果的计数组件;如果为 FALSE,则绘制概率密度、分量密度(因此直方图的总面积为 1)。当且仅当中断是等距的(并且未指定概率)时,默认为 TRUE。
谢谢
编辑:细节
嗯,所以我的情节高于 1,如果这是一个概率,这将非常令人困惑。我现在看到它与 bin 宽度有什么关系。我或多或少想让每个垃圾箱都值 1 分,同时仍然有很多垃圾箱。换句话说,任何 bin 高度都不应高于 1.0,除非它直接位于 1.0 并且所有其他 bin 均为 0.0。就目前而言,我有一个在 15.0 左右形成驼峰的垃圾箱
编辑:bin @Dwin 中的 %points 高度:那么我如何绘制概率?我意识到由于 x 轴上的单位,积分仍然会给我 1.0,但这不是我想要的。假设我有 100 个点,其中 5 个点落入第一个箱子,那么那个箱子的高度应该是 0.05。这就是我要的。我做错了吗,还有另一种方法吗?
我知道我有多少分。有没有办法将频率直方图中的每个 bin 计数除以这个数字?