r - R：在 ddply 中获取子集的长度

Question

所以我有一个包含以下列的数据集：test_group、person_id、gross、购买。这本质上是一个人的列表，他们花了多少钱，他们购买了多少次，以及他们所在的群体。

我正在使用以下 ddply 代码来获取一些摘要统计信息：

mean_rpu <- ddply(data, .(test_group), summarise, total_rpu=sum(gross),
    total_users=length(person_id), total_purchasers=length(subset(data,  
    purchases > 0)$person_id), mean_rpu=mean(gross), sd_rpu=sd(gross))

我遇到的问题是“total_purchasers”摘要。我正在尝试计算每个 test_group 中购买者的人数。当前代码仅显示整个数据集中的 total_purchasers，不代表 test_group 因子。我可以用这个做任何优化吗？

感谢您的帮助！

score 10 · Accepted Answer

如果没有可重现的例子，很难确定，但也许你想要这个：

total_purchasers=length(person_id[purchases>0])

r - R：在 ddply 中获取子集的长度

1 回答 1

Related

Reference