r - 为分组频率数据计算 R 中的密度（）

Question

这应该是一个非常简单的问题，但我在任何地方都找不到答案（部分原因是我不确定要查询什么）。

在 R 中，很容易计算以下的密度：

c(1, 2, 2, 2, 3, 5, 5, 7, 8, 10, 10, 10)

你只需这样做：

density(c(1, 2, 2, 2, 3, 5, 5, 7, 8, 10, 10, 10))

问题是，如果我的数据有一个像这样的“未分组”向量，那么 R（或构建数据集的查询引擎）将无法处理它。所以我需要在初始查询中使用GROUP BYandCOUNT(*)来压缩我的结果（因此，使用rep()扩展计数没有帮助）。给定这样一个“计数”数据框，我如何计算如下框的密度（对于 KDE 图）：

Value Count
1     1
2     3
3     1
5     2
7     1
8     1
10    3

为了清楚起见，我确实需要密度图，而不是直方图。

score 2 · Accepted Answer

Just use the weights argument

density(d$Value, weights=d$Count/sum(d$Count))

(edited to account for first comment)

r - 为分组频率数据计算 R 中的密度（）

1 回答 1

Related

Reference