问题标签 [lifelines]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
204 浏览

python - python生命线中的求生功能太乐观了?

我是生存分析的新手,并使用 Python 的 Lifeline 快速编写了基线生存函数。但与我根据数据自己绘制的留存曲线相比,我得到的图表过于乐观。

下面是我根据我的数据制作的图表。它显示了来自不同群组的客户停留了多少周。很明显,来自比利时的人(红线)比来自荷兰的人停留的时间更长。20周后,56%的比利时客户还在,而荷兰人只有43%。

保留曲线 保留曲线

但是当我使用 Python 的生命线 CoxPHFitter 绘制生存函数时,我得到了下图:

在此处输入图像描述

显示20周后“还活着”的概率,比利时人70%以上,荷兰人50%以上。

为什么这些数字不同?我是否误解了其中一条曲线?

这是我的代码:

如果客户不再订阅,则“已停止”设置为 1。“weeks_subscribed”的平均长度为 18。

编辑:

我手动计算保留图的方式如下:

0 投票
1 回答
33 浏览

python - 找到生命线危险函数的局部最大值

我正在尝试找到一种方法来检测危险函数的局部最大值点(使用生命线库绘制)。

Lifelines 库使您能够直观地绘制危害函数( plot.hazard() ),但是 - 如上所述 - 它只是函数的视觉表示,而不是函数本身。这意味着您显然不能将此函数作为参数传递给方法(即:来自 scipy.signals 库的 find_peaks)。

我想知道是否有人有解决方案来检测这些问题,请在下面找到我如何计算我的危险函数(在我突出显示局部最大值的最右边的图):

在此处输入图像描述

感谢任何会帮助我的人。

斯特凡诺

0 投票
0 回答
58 浏览

python - 如何使用 CoxTimeVaryingFitter 预测 Cox 时变比例风险模型中的概率?

我要预测 Cox 时变比例风险模型 (CoxTimeVaryingFitter) 中的概率。我拟合 CoxTimeVaryingFitter 并得到基线累积危险 h0(t) (baseline_cumulative_hazard_) 和部分危险 (predict_partial_hazard)。乘法后,我注意到有时我的预测大于 1。这是我的代码:

你知道吗,我怎样才能得到生存模型在 0 到 1 范围内的概率?

0 投票
0 回答
101 浏览

python - 如何在 Kaplan Meier 曲线上显示置信区间

我使用 python 生命线模块创建了一个生存曲线。生命线模块中是否有一个函数可以用来显示我的绘图的置信度以及 x 轴上的 number_at_risk。我知道confidence_interval_输出置信区间表的函数。但我想在图表上显示 95% 的间隔值,就像在第二张图片中一样。

创建一个 kmf 对象为 km

在此处输入图像描述

在此处输入图像描述

0 投票
0 回答
18 浏览

data-science - 如何避免 Python 的 Lifelines 包的 AalenAdditiveFitter 中的 MemoryError

我们正在研究与生存分析相关的问题。我们已经实现了 Cox 比例风险模型和加速故障时间算法。现在我们想看看协变量如何随时间变化。所以我们决定AalenAdditiveFitterlifelines库中实现。这是一个虚拟数据。数据形状为(1341799, 4).

现在,我们面临的问题与内存有关。一个热编码后的数据形状变为(1341799, 15)。但是,当我们尝试将数据拟合到模型中时,列数只会增加到1904from15并且数据会被转置。

这是我们尝试运行的代码。

这是我们得到的错误。

当我们减少行数(比如 50k 行)时,代码可以正常工作。但这不符合我们的目的。如何解决这个问题?

另外,任何人都可以解释引擎盖下发生了什么吗?有没有办法解决这个问题?是否有任何其他方法可用于捕获协变量在整个时间内的可变性?

您可以使用以下代码生成我们的数据。

0 投票
1 回答
14 浏览

python - 在 GUI 中显示统计结果

我有一个数据集并使用生命线库对其执行 kaplan meier 分析,然后执行对数秩和 cox 分析,但我收到的输出是“统计结果”类型,我可以在 GUI 上显示它,但无法弄清楚。