1

我已经为一家电子商务公司的数据建立了一个流失预测模型。在该模型中,流失标准将在数据中最后一个可用日期起 12 个月内处于非活动状态。在构建模型时,我创建了一些计算特征来考虑预测中的活动。我将客户最近 3 个月和 6 个月的活动添加为二进制文件。它们与流失的相关性分别为 0.5 和 0.7。当我检查网络上的其他流失预测模型时,我在一些项目中看到了类似的指标,而另一些项目不包括这样的指标。

我的模型的准确率约为 90%,我担心如果我将客户最近 3 个月和/或 6 个月的活动作为模型的输入做错了。此外,我应该担心 3m 活动和 6m 活动之间的相关性吗?我使用 PCA 进行特征提取,保持 0.95 的方差,但这足以避免相关问题吗?

4

0 回答 0