0

这是我第一次在这里提问,所以如果我做错了什么,请引导我到正确的地方。我有一个大而干净的数据集。(29000+,24)。问题是我必须根据 4 个不同的分类列来计算流失率,并且我只得到 1 列包含给定期间的子项。我也有一个日期栏。我计算流失率的想法是

churn_rate= (Sub_start_period-Sub_end_period)/Sub_start_period*100 

问题

我不知道如何使用这 4 个不同的分类变量对数据进行分组。此外,如果我设法这样做,我最终会得到超过 200 个不同的表,所以我不相信这将是一个好方法。

我的目标是能够使用表中的信息来预测流失率,但我应该能够根据这些变量确定流失率。流失没有给出,它必须被计算,所以我在这里遇到了问题,因为我想不出解决这个问题的方法。

4

0 回答 0