按年份划分计算保留率/流失率
亲爱的社区,我正在从事一个数据挖掘项目,我想将先前的想法从 excel 转换为 R。
我有一个包含合同数据的客户数据库,并想计算保留率。我在玩这些library(lubridate)
;library(reshape2)
; library(plyr)
但我无法弄清楚它在 R 中是如何工作的。
我有这样的数据:
ID Customer START END
1 Tesco 01-01-2000 31-12-2000
2 Apple 05-11-2001 06-02-2002
3 H&M 01-02-2002 08-05-2002
4 Tesco 01-01-2001 31-12-2001
5 Apple 01-01-2003 31-12-2004
我现在正在考虑将数据拆分为年份(df2000,df2001),然后在主表中存在客户名称时再次查找(如果是,则返回 1)。
结果可能如下所示:
Customer 2000 2001 2002 2003 Retention Rate
Tesco 1 1 0 0 0.5
Apple 0 1 0 1
H&M 0 0 1 0