问题标签 [churn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
26 浏览

pandas - 需要使用多个类别和日期时间在各种表中划分数据框

这是我第一次在这里提问,所以如果我做错了什么,请引导我到正确的地方。我有一个大而干净的数据集。(29000+,24)。问题是我必须根据 4 个不同的分类列来计算流失率,并且我只得到 1 列包含给定期间的子项。我也有一个日期栏。我计算流失率的想法是

问题

我不知道如何使用这 4 个不同的分类变量对数据进行分组。此外,如果我设法这样做,我最终会得到超过 200 个不同的表,所以我不相信这将是一个好方法。

我的目标是能够使用表中的信息来预测流失率,但我应该能够根据这些变量确定流失率。流失没有给出,它必须被计算,所以我在这里遇到了问题,因为我想不出解决这个问题的方法。

0 投票
1 回答
49 浏览

python - 如何根据客户 ID / 电子邮件计算流失率?

我正在尝试使用以下数据每月计算客户流失率。然而,不幸的是,当客户流失或不流失时,我没有一个布尔值,它取值为 1/True 或 0/False。您可以假设当客户在某个月份订购时,他/她没有流失,而当他/她在该月没有订购时,他/她就流失了。我明白这会导致流失率波动,但现在这并不重要。

日期 客户ID 项目
2017-11-07 19:06:43 00001 面包、牛奶
2017-11-07 20:06:43 00002 面团
2017-12-07 21:06:43 00003 苹果
2018-01-07 21:06:43 00002 萝卜
2018-01-07 21:06:43 00001 键盘, 豆浆机
2018-02-07 21:06:43 00003 馅饼
2018-03-07 21:06:43 00002
2018-03-07 21:06:43 00003
2018-04-07 21:06:43 00004 口香糖

我尝试使用按月重新采样它们

随后我有每个月的订单数量,但我不知道谁流失了。我希望有人可以帮助我解决这个问题。

非常感谢 :)

0 投票
1 回答
18 浏览

mysql - 在 SQL 请求中获取按年分组的用户流失率

我需要在单个 SQL 请求中获取按年份和用户类型分组的用户流失率值。

流失率 = 今年流失的用户数(存档)/(今年年初的用户数 + 今年注册的用户数)

今年丢失的用户 - 在特定年份内拥有“archive_date”(DATETIME)字段的用户。

用户计数- 可以通过“注册”(DATETIME)字段计算。

我需要按数据库中存在的所有年份(用于用户注册日期)对这些数据进行分组,并按用户类型进行分组。

预期结果(只是一个样本):

示例数据数据库小提琴: https ://dbfiddle.uk/?rdbms=mysql_5.7&fiddle=0f79c8fb40b6c1185908f91ce39d6251

例如对于这个示例小提琴在 2020 年注册了 1 个新用户,我们在 2020 年初有 2 个用户(他们在 2019 年注册),我们有 1 个用户在 2020 年存档,所以(如果我们不按用户类型分组) 2020 年的总体流失率将是:

流失率 = 1 / (2 + 1) = 0.33(33% 流失率)

代码应该适用于 MySQL 5.7。

0 投票
0 回答
8 浏览

python - 带日期功能的流失如何处理?

我有一个包含 2 个时间戳(event_timestamp、first_event_timestamp)的游戏数据。我知道流失分析并且以前做过,但我不知道如何使用日期数据进行流失分析。在案例中,我被要求使用 4 天的数据进行 30 天的客户流失预测。在此处输入图像描述

在此处输入图像描述

和这个信息 数据信息

0 投票
1 回答
13 浏览

machine-learning - 如何为预测添加一些全局和本地可解释性,以了解客户流失的原因?

主要目标是了解:

  1. 客户流失的可能性有多大?
  2. 确定每个用户的流失原因。

目前,我使用的是随机森林模型。我可以看到所有用户最重要的功能。有没有办法让每个用户都获得重要的功能?例如,可能一个客户因为不喜欢该产品而离开,而另一个客户因为它是昂贵的产品而离开,等等。

提前致谢!