问题标签 [lifelines]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - python生命线中的求生功能太乐观了?
我是生存分析的新手,并使用 Python 的 Lifeline 快速编写了基线生存函数。但与我根据数据自己绘制的留存曲线相比,我得到的图表过于乐观。
下面是我根据我的数据制作的图表。它显示了来自不同群组的客户停留了多少周。很明显,来自比利时的人(红线)比来自荷兰的人停留的时间更长。20周后,56%的比利时客户还在,而荷兰人只有43%。
但是当我使用 Python 的生命线 CoxPHFitter 绘制生存函数时,我得到了下图:
显示20周后“还活着”的概率,比利时人70%以上,荷兰人50%以上。
为什么这些数字不同?我是否误解了其中一条曲线?
这是我的代码:
如果客户不再订阅,则“已停止”设置为 1。“weeks_subscribed”的平均长度为 18。
编辑:
我手动计算保留图的方式如下:
python - 如何使用 CoxTimeVaryingFitter 预测 Cox 时变比例风险模型中的概率?
我要预测 Cox 时变比例风险模型 (CoxTimeVaryingFitter) 中的概率。我拟合 CoxTimeVaryingFitter 并得到基线累积危险 h0(t) (baseline_cumulative_hazard_) 和部分危险 (predict_partial_hazard)。乘法后,我注意到有时我的预测大于 1。这是我的代码:
你知道吗,我怎样才能得到生存模型在 0 到 1 范围内的概率?
data-science - 如何避免 Python 的 Lifelines 包的 AalenAdditiveFitter 中的 MemoryError
我们正在研究与生存分析相关的问题。我们已经实现了 Cox 比例风险模型和加速故障时间算法。现在我们想看看协变量如何随时间变化。所以我们决定AalenAdditiveFitter
从lifelines
库中实现。这是一个虚拟数据。数据形状为(1341799, 4)
.
现在,我们面临的问题与内存有关。一个热编码后的数据形状变为(1341799, 15)
。但是,当我们尝试将数据拟合到模型中时,列数只会增加到1904
from15
并且数据会被转置。
这是我们尝试运行的代码。
这是我们得到的错误。
当我们减少行数(比如 50k 行)时,代码可以正常工作。但这不符合我们的目的。如何解决这个问题?
另外,任何人都可以解释引擎盖下发生了什么吗?有没有办法解决这个问题?是否有任何其他方法可用于捕获协变量在整个时间内的可变性?
您可以使用以下代码生成我们的数据。
python - 在 GUI 中显示统计结果
我有一个数据集并使用生命线库对其执行 kaplan meier 分析,然后执行对数秩和 cox 分析,但我收到的输出是“统计结果”类型,我可以在 GUI 上显示它,但无法弄清楚。