“scikit-survival”的相关标签问题

0 投票

2 回答

1753 浏览

python - 如何从 python 中拟合的 scikit-survival 模型解释 .predict() 的输出？

我很困惑如何解释scikit-survival 中.predict拟合模型的输出。CoxnetSurvivalAnalysis我已经阅读了scikit-survival 中的笔记本 Intro to Survival Analysis和 API 参考，但找不到解释。以下是导致我困惑的一个最小示例：

所以这是进入模型的X：

...继续拟合模型并生成预测：

preds具有与相同数量的记录X，但它们的值与中的值完全不同data_y，即使在它们拟合的相同数据上进行预测时也是如此。

输出：

那么究竟是preds什么？显然.predict，这里的含义与 scikit-learn 中的完全不同，但我不知道是什么。API 参考说它返回“预测的决策函数”，但这是什么意思？以及如何在yhat给定的几个月内达到预测的估计值X？我是生存分析的新手，所以我显然遗漏了一些东西。

2017-11-13T22:05:21.737

0 投票

1 回答

375 浏览

machine-learning - 如何处理审查实例？

我正在开展一个项目，使用机器学习方法和包含大约 900 个变量的数据集来预测事件（移植失败）的日期，我是这个领域的新手，我不确定我是否走在正确的轨道上。

起初，我使用神经网络在 python 中使用 Keras 库进行预测，然后我发现我的数据中有 70% 的审查实例（Y 变量）。但是，除了 Y 之外，我还有一个后续变量。所以，我得出结论，我不应该使用神经网络来解决这类问题，而且我必须事先处理审查数据。现在我有三个问题：

1）有这样的审查数据率是否正常？我们应该如何处理这种情况？

2) 我的结论是否正确，即神经网络不是解决我的问题的最佳方案？如果不是，最常见的机器学习方法是什么？我为此目的找到了生命线和 scikit-survival 包，但我不知道哪个更好，它是正确的解决方案。

3）我用后续变量替换了审查数据，而根据我的数据集中审查数据的高比例，我认为它不合适。我意识到我应该使用另一种方法，如校准，但我找不到执行此操作的 python 库。你能帮我解决这个问题吗？Pyhton 中通常用于校准什么？

machine-learning keras survival scikit-survival

2018-02-26T22:46:50.463

0 投票

1 回答

115 浏览

pyasn1 - 无法安装 scikit-survival 软件包。得到一个 Pyasn1 错误和一个“dill”错误

我一直在尝试安装 scikit-survival 包以进行生存分析，但每当我尝试这样做时，我都会收到如下所示的错误。

错误

pyasn1-modules 0.1.5 has requirement pyasn1<0.4.0,>=0.3.4, but you'll have pyasn1 0.1.9 which is incompatible. 错误

pyasn1 scikit-survival

2018-06-27T10:47:44.867

0 投票

0 回答

85 浏览

python - GBM生存的难以置信的可变重要性：重要性的恒定差异

我有一个关于 GBM 生存分析的问题。我正在尝试在 3614 个人的数据集中量化我的变量（n = 453）的变量重要性。具有可变重要性的结果图看起来很可疑。我以前计算过 GBM，但从未见过这种渐进模式的重要性。重要性条之间通常有不同的距离；在这种情况下，重要性似乎一直存在差异。我的数据框称为 df。由于数据的敏感性，我无法上传样本数据。相反，我的问题涉及获得这些可变重要性的合理性。