0

我正在尝试预测客户流失,为此我的因变量是一个二元变量。自变量可以是分类、整数或时间序列数据。我处于特征选择模式,想知道我是否在运行关联,是否应该对时间序列数据运行关联。如果我确实使用包装器方法并使用 ML 算法来解决此类问题,我是使用更适合时间序列分析的 ARIMA 模型还是决策树模型?

我尝试使用 Spearman 相关性,但没有找到任何显着的相关因变量

4

1 回答 1

0

你很可能应该!由于流失率可能会受到自相关函数中显示的宏观经济问题的影响。我建议访问 statsmodel 并确保您了解 ACF 图和 PACF 图(可以很容易地使用 statsmodel 完成)以及 ARIMA 模型,以便您可以进行一些微调。至于特征选择,您可以尝试使用过拟合的神经网络或具有 L1 正则化的模型。 https://www.statsmodels.org/stable/index.html

于 2019-09-07T11:47:02.410 回答