我有如下数据:
> head(ddd)
id affiliate_id affiliate_account_id source Pipeline num good bad
1 61046463 1006 69 29eada Contact Info Bad 1 FALSE TRUE
2 61046770 1006 69 344f39 Did not Reach 1 TRUE FALSE
3 61053937 1006 69 fff384 na 1 TRUE FALSE
4 61053941 1006 69 22d8b6 App Out 1 TRUE FALSE
5 61060137 1006 69 29eada No Offer 1 TRUE FALSE
6 61060221 1006 69 3fdb4f Contact Info Bad 1 FALSE TRUE
我正在尝试使用 ddply 函数汇总数据,以便获得如下内容:
affiliate_id affiliate_account_id lead_count good_count bad_count good_rate bad_rate
1 1006 69 360 300 60 % %
2 1006 5212 64 60 4 % %
3 1031 5102 22 3 20 % %
4 1035 5211 5 15 10 % %
5 1035 5216 90 30 60 % %
其中百分比 (%) 是好/坏的比率,即affiliate_account_id。
我似乎无法弄清楚如何获得列数并评价食物的好坏。任何人都可以帮助从以下到上表中的最后四列。
ddply(ddd, .(affiliate_id, affiliate_account_id), summarise, lead_count=length(affiliate_id))