这应该是一个非常简单的问题,但我在任何地方都找不到答案(部分原因是我不确定要查询什么)。
在 R 中,很容易计算以下的密度:
c(1, 2, 2, 2, 3, 5, 5, 7, 8, 10, 10, 10)
你只需这样做:
density(c(1, 2, 2, 2, 3, 5, 5, 7, 8, 10, 10, 10))
问题是,如果我的数据有一个像这样的“未分组”向量,那么 R(或构建数据集的查询引擎)将无法处理它。所以我需要在初始查询中使用GROUP BY
andCOUNT(*)
来压缩我的结果(因此,使用rep()
扩展计数没有帮助)。给定这样一个“计数”数据框,我如何计算如下框的密度(对于 KDE 图):
Value Count
1 1
2 3
3 1
5 2
7 1
8 1
10 3
为了清楚起见,我确实需要密度图,而不是直方图。