我正在尝试对订阅的客户生命周期进行建模。由于数据被审查,我将使用 R 的生存包来创建生存曲线。
原始订阅数据集如下所示..
id start_date end_date
1 2013-06-01 2013-08-25
2 2013-06-01 NA
3 2013-08-01 2013-09-12
我操纵它看起来像这样..
id tenure_in_months status(1=cancelled, 0=active)
1 2 1
2 ? 0
3 1 1
..为了养活生存模型:
obj <- with(subscriptions, Surv(time=tenure_in_months, event=status, type="right"))
fit <- survfit(obj~1, data=subscriptions)
plot(fit)
对于 consored 案例,即订阅今天仍然有效的案例,我应该在 tenure_in_months 变量中放入什么 - 它应该是直到今天的任期还是应该是 NA?