问题标签 [churn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
66 浏览

machine-learning - 在线时装公司的流失预测模型

我一直在使用在线时装公司数据集开展一个单独的项目。我的目标是建立一个流失预测模型。为了做到这一点,我设置了一个流失标准,以便客户在 12 个月不活动的情况下流失。但是我在决定训练模型的数据时间线时感到困惑。由于客户流失期是特定于客户的,因此我无法设置特定的日期间隔。我的数据集介于 2015 年和 2018 年 3 月之间,我认为选择一个在 2016 年有交易的样本客户会很好。然后我在数据集中取了最后一个可用日期,即 2018 年 3 月的某一天,并回顾了 12 个月确定谁流失了。然后我选取了我选择的那些在 2016 年进行交易的客户,并在可用数据期间(2015-2018 年)获取了他们的所有交易数据。我还在模型中添加了一个功能,检查客户在过去 3 个月内是否有交易作为二进制变量。但是,我觉得这里有一个错误。我是一个自学成才的人,我找不到合适的指南来在互联网上构建模型。大多数流失预测模型都没有足够详细地讨论数据准备。我希望有人与我分享他们宝贵的想法

0 投票
1 回答
89 浏览

python - 如何使用性能窗口中的数据测试客户流失预测

我正在研究客户流失预测。观察和性能窗口的切片如下:

对于具体情况,窗口是:

number_of_months=18 predict_period_months=4

用户资料基于过去 18 个月的行为和最近 4 个月未用于培训和测试的行为。

结果,我使用 Lightgbm 获得了不错的分数:

宏观平均 0.93 0.93 0.93 98184 加权平均 0.93 0.93 0.93 98184

准确度 = 0.9309256090605394

关于如何将过去 4 个月的信息用于测试训练的模型,有什么建议吗?

0 投票
1 回答
150 浏览

r - 使用 bartCause 包预测隆起

我正在尝试使用 bartCause 包在 R 中构建提升模型。不幸的是,我无法以正确的方式集成数据框 -错误消息

使用的代码:

校准数据:(2595 个观测变量,共 15 个变量) 在此处输入图像描述

验证数据:(2595 个变量,共 15 个变量) 在此处输入图像描述

0 投票
2 回答
52 浏览

python - 如何比较熊猫中的两行(跨所有列),并对输出求和?

我有这样的数据-

现在我想做的是每两周比较一次,找出所有变化为 1->0 的情况。

所以上述数据的输出将是这样的 -

0 投票
1 回答
91 浏览

python - 如何根据特定条件转换和创建具有 0 和 1 的 pandas 列

我想创建一个churn如图所示的列。代码应该对每年的列进行分组和比较Col,如果Col在明年找到值,则分配 0。

在此示例中,2017 年缺少第 3 行。因此分配 1。

我如何在熊猫中做到这一点?

0 投票
0 回答
43 浏览

sql - 如何对从 Redshift 中的多个表导入的数据进行过滤和分组?

很高兴认识你,亲爱的社区!我想从几个表中选择自注册日起不迟于 7 天执行最后一次活动的用户,并按他们的开始版本对他们进行分组。

但是,选择的用户数量很少,您能告诉我我哪里出错了吗?

0 投票
0 回答
20 浏览

retention - 留存率 - 如何对待回头客

我正在计算网站订阅者的保留率 - 每月/每年为网站付费的用户。

离开的订户是停止为网站付费的订户。如果离开的订户返回站点,他将获得相同的订户 ID。我不知道如何对待回头客。例如:

例子

最后一个月的留存率应该是 3/3 还是 2/3?

0 投票
0 回答
40 浏览

python - 对客户交易数据进行傅里叶分析的建议

我目前正在为公司制定一项战略,以通过将傅立叶变换应用于客户交易数据的商业智能来减少客户流失并监控客户健康状况。许多企业的客户具有周期性的消费习惯,检测模式可以帮助识别客户当前的行为何时具有欺诈性,表明他们离开了服务,或者表明他们在成长过程中需要帮助。

给定客户支出数据,可以按多种方式分类,客户也可以,我尝试在 Jupiter Notebook 中使用以下代码获取信号

这是一个有效的前提吗?我没有成功地为我的任何样本循环客户数据在频域中绘制干净的响应。使用不同的指标会更好吗,比如他们的每日支出——最近一段时间的移动平均每日支出?这将跌至负值并稳定在零附近。

请让我知道你的想法!

0 投票
2 回答
60 浏览

python - 将下面的数据集分为两类并稍后使用 Pyspark 删除冗余行的最佳方法?

我的数据集:

事件类型分为三类:查看、购物车和购买。我想用一个新列 is_purchased=1 对 user_id 和 product_id 进行分类,如果它的事件类型为购买,其他为 0。之后,我将删除冗余行,如下所示,这基本上可以帮助我分类我的数据是否客户是否会流失。

删除冗余数据的图示

我正在考虑使用 user_id 和 product_id 对数据进行分区,然后对已购买的数据进行分类。请建议您解决此问题的方法?

0 投票
1 回答
140 浏览

python - 如何按月找到流失客户?蟒蛇熊猫

我有一个大型客户数据集,其中包含客户 ID、服务 ID、产品等。因此,我们可以衡量流失的两种方法是在客户 ID 级别,如果整个客户离开,在服务 ID 级别,其中也许他们取消了 5 项服务中的 2 项。

数据看起来像这样,我们可以看到

  • Alligators 在 1 月底停止成为客户,因为他们在 2 月没有任何行(CustomerChurn)
  • 阿姨在 1 月底不再是客户,因为他们在 2 月没有任何行(CustomerChurn)
  • 1 月和 2 月,砖块继续供应苹果和橙子 (ServiceContinue)
  • Bricks 继续成为客户,但在 1 月底取消了两项服务 (ServiceChurn)

我正在尝试编写一些创建“流失”列的代码。我尝试过

  • 从 2019 年 10 月开始使用 Set 手动获取 CustomerID 和 ServiceID 列表,然后将其与 2019 年 11 月进行比较,以找到流失的列表。这不是太慢,但似乎不是很 Pythonic。

谢谢!

在此处输入图像描述