问题标签 [churn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
150 浏览

ruby-on-rails - Ruby churn 在安装时需要 churn (>= 0)

我正在尝试安装度量标准,但失败了

尝试以下操作也会出错。

当 churn 需要自己时,有谁知道如何安装 churn?

0 投票
1 回答
1047 浏览

visual-studio - TFS 代码流失计数缩进

参与软件测量项目。我们想使用 TFS Code churns 来确定我们拥有的每个项目的大小。按照这条指令,我们已经在特定的时间内达到了代码搅动。不幸的是,TFS 将缩进计入代码搅动中!有没有办法告诉 TFS 不要计算代码流失中的缩进和空格?

环境:TFS 2012、Visual Studio 2010、2012

0 投票
1 回答
1041 浏览

machine-learning - 客户流失分类

对于一个学术项目,我必须分析一家保险公司的客户数据库。这家保险公司想确定几件事,首先对离开公司的客户进行分类,以便为他们提供一些优惠等。然后他们还想知道对哪些客户进行追加销售或交叉销售,如以及在保险索赔方面寻找有风险的客户。

所以我专注于客户取消,因为这似乎是最重要的。

保险公司提供的属性有:

捆绑/非捆绑、保单状态、保单类型、保单组合、签发日期、生效日期、到期日、保单期限、贷款期限、取消日期、取消原因、总保费、拆分器保费、合作伙伴 ID、代理 ID、国家代理、区域 ID、代理潜力、性承包商、出生年份承包商、工作承包商、性别被保险人、工作被保险人、出生年份被保险人、年份索赔、索赔状态、索赔条款、索赔付款

该数据库由约 20 万条记录组成,并且某些属性存在许多缺失值。我开始使用 Rapid Miner 来挖掘数据集。我稍微清理了数据集,删除了不连贯或错误的值。

然后我尝试应用决策树,添加一个从策略状态(可以发布、更新或取消)派生的新属性,称为 isCanceled,并将其用作决策树的标签。我尝试更改决策树的每个参数,但要么得到一棵只有 1 个叶节点且没有分裂的树,要么得到一些完全不相关的树,因为它的叶节点具有几乎相同数量的 2 个类实例。这真是令人沮丧。

我想知道进行流失分析的常用程序是什么,可能使用 Rapid Miner ..有人可以帮助我吗?

0 投票
1 回答
3191 浏览

java - 如何测量 C++ 或 Java 文件的复杂性?

我想开始衡量 Michael Feathers 所说的代码的动荡,即churn vs.complexity

为此,我需要测量 C++ 或 Java 文件的复杂性。所以我找到了几个测量圈复杂度(CC)的工具。他们每个人都在功能或方法级别上很好地衡量了 CC。但是,我需要一个文件级别的指标,而他们在那里做得不太好。一个工具只返回文件中所有方法复杂度的平均值,而另一个工具将整个文件视为一个巨大的方法,即它计算整个文件中的所有决策点。

所以我做了一些研究,发现 McCabe 仅根据模块来定义 CC——他们将模块定义为函数——而不是文件(参见本演示文稿的幻灯片 20 和 30 )。我认为这是有道理的。

所以现在我只剩下试图弄清楚如何表示文件复杂性了。我的想法是我应该只使用该文件的最大方法 CC。

关于这种方法或任何其他建议的任何想法?

谢谢!

0 投票
1 回答
957 浏览

time-series - 时间序列归一化,如何处理零

我正在研究游戏的玩家流失预测模型。我有 60 天的时间序列轮数。在将时间序列提供给分类算法之前,我需要对时间序列进行规范化。

我正在考虑通过将 x 转换为 x/Max(x) 来使用 min-max 归一化。60 天时间序列中的 Max(x) 不一定能捕捉到玩家通常一天玩多少次的峰值。

但是通过将 x 转换为 (x-mean(x))/std(x) 的 z 归一化将不起作用,因为我需要保留没有播放的日子的信息为零。进行 z 归一化将 0 映射到不同的值,这使得它们无法比较。

是否有一个标准化方案不需要关于时间序列最大值的信息并且可以将 0 映射到 0?

0 投票
1 回答
3073 浏览

r - 如何将预测值映射到数据集中的唯一 ID?

我已经编写了这个 R 代码来重现。在这里,我创建了一个唯一列“ID”,我不确定如何将预测列添加回测试数据集映射到它们各自的 ID。请指导我正确的方法来做到这一点。

0 投票
1 回答
594 浏览

p2p - 循环分布式哈希表覆盖 P2P 网络

我想我在这里遗漏了一些东西或混淆了术语。

当对等点离开 p2p 网络时,存储在覆盖 DHT 中的对等点处的键值对会发生什么情况?他们是否被转移到新的合适的最近继任者?如果是这种情况,是否有标准机制。

我的理解是,当对等方离开时,必须按预期修改相邻对等方的继任者和前任对等方信息,但是我似乎无法找到有关存储在该对等方的实际数据发生什么情况的信息。当发生对等流失时,DHT 中的数据如何保持完整?

谢谢你。

0 投票
1 回答
211 浏览

classification - 将零售客户分类为流失 Y 或 N 的标准

我有零售交易数据集。一些属性是 CUSTID、BILL_DT、ITEM_Desc、VALUE。我想将 custid 分类为 churn y 或 n。我应该使用上次购买日期到现在之间的天数作为分类标准吗?我可以说超过 180 天客户流失的任何内容吗?costco、walmart等大零售商使用的标准是什么?

谢谢,

0 投票
0 回答
757 浏览

r - R中的客户流失和生存分析

我有这样的数据框

其中min_datemax_date表示每个 的时间边界(购买开始日期和最后购买日期)product_ID。我尝试使用以下代码拟合 cox 比例风险

M是我上面表格的数据,它运行良好。现在我正在尝试预测客户流失和所有其他相关的生存分析(KM 估计)并绘制流失率和风险率。请在这种情况下帮助我。

我也设法为“事务”类型构建了一个数据框,用于关联规则分析。如果您可以通过使用 R 编程中的“事务”格式数据集找出任何类型的生存分析,那就太好了。

谢谢。

注意:: 黄土图链接 http://192.168.2.165:8787/graphics/plot_zoom?width=881&height=475&scale=1

0 投票
1 回答
173 浏览

r - 在给定数据变量的 R 中计算流失率

我正在尝试使用 R 计算保留学生的数量。我正在使用的两个变量是“registration_date”(mm/dd/yr)和“date_of_last_login”(mm/dd/yr)。如果学生在前 30 天内登录,则视为保留学生。

我想这个想法是创建一个新变量:'retained students',但我不确定如何在 R 中设置公式。