问题标签 [survival-analysis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1354 浏览

r - 获得每个个体实例的 Kaplan-Meier 生存风险

问题

给定具有和变量(除其他外)的n患者记录,我想获得他们在他们所处的时间段内的生存风险,即 2、4、6、8、10 年。timestatus

我有 24 - 47 个月(2 年)、48 - 83 个月(4 年)、84 - 107 个月(6 年)、108 - 119 个月(8 年)和 120 个月的部门——“最多可用”个月(10年)。

从个人的角度来看,一个生存月数为 30 个月的患者将被包括在两年期间内,并且与其他预测变量一起,我想知道该患者在两年内的生存风险。

我的方法

我正在使用此线程中描述的 R 代码检索我的数据的生存风险百分比。

time变量是生存月份,具有status10分别代表活着和死去。

代码输出如下内容(取自此处):

我的问题是:这些是我需要使用的 300,000 条个人记录的实际生存估计survest(0:300000)吗?我尝试过survest(0:1000),但结果已经收敛到某个值,这并不能解决我的问题。

0 投票
1 回答
14056 浏览

r - coxph() X 矩阵被认为是奇异的;

我在使用 coxph() 时遇到了一些麻烦。我有两个分类变量:“tecnologia”和“pais”,我想评估“pais”对“tecnologia”的可能交互影响。“tecnologia”是一个具有 2 个级别的变量因子:gps 和 convencional。而“pais”分为 2 个级别:PT 和 ES。我不知道为什么这个警告不断出现。这是代码和输出:

我正在就这个主题提出另一个问题,尽管几个月前我提出了一个类似的问题,因为我再次面临同样的问题,还有其他数据。这次我确定这不是与数据相关的问题。

有人可以帮助我吗?谢谢

更新: 问题似乎不是一个完美的分类

0 投票
0 回答
222 浏览

r - 使用 R 进行条件逻辑回归(clogit 和 coxph)的 Rmpi

我正在尝试在具有多个节点的计算中心运行条件逻辑回归,以评估 9.69 亿行的大数据集。但是计算取消了,因为作业超过了最大容量节点的最大内存 90GB。

我听说 R 包“Rmpi”可以在多个节点上运行计算。

我正在使用以下代码运行条件 logit 回归:

是否可以使用 Rmpi​​ 进行此计算,如果可以,我如何在代码中实现它?

我真的很感激任何帮助来解决这个问题。

非常感谢您提前。

0 投票
0 回答
1044 浏览

r - R运行clogit中的“捕获段错误”和“内存未映射”

我正在尝试使用 R 中的以下脚本对 9 x 484995115 矩阵运行条件逻辑回归

但是在具有 256GB 内存的节点上计算 2 小时后,程序停止并显示以下错误消息:

这个错误的原因是什么?在计算期间从未超过内存容量。我可以在代码中进行哪些更改以避免此错误?

我真的很感激任何帮助来解决这个问题。

非常感谢您提前。

0 投票
1 回答
2043 浏览

graph - 绘制多个双向函数时的不完整线

我正在使用 Stata 绘制多个函数。在这种情况下,我正在绘制不同的 Gompertz 生存函数;一岁30一岁70

首先,考虑30-岁:

如您所知,比例参数有一个常数 ( -3.520509) 和年龄 ( 0.0762475),而形状有一个常数 ( 0.0378969)。

年龄以平均值为中心,这就是协变量为-34( 64 - 34 = 30) 的原因。

其次,考虑70-岁:

两个函数单独绘制时都很好。

但是,当我绘制两者时,一条曲线没有完成:

你能帮助我吗?

0 投票
1 回答
4138 浏览

r - R - 不包括因子水平的 cox 风险模型

我正在将 cox 模型拟合到一些结构如下的数据:

RUTH.CLASS变量实际上是一个因素,我已将其更改为一个因素:

伟大的。

拟合模型后

当我在模型中拟合更多变量时,会发生类似的事情:

model.matrix从下面截断输出:

我们可以看到,每一个的第一级都被排除在模型之外。任何投入将不胜感激。我注意到在LESION.TYPE变量上,""没有包含空白级别,但这不是设计使然——应该是 aNA或类似的东西。

我很困惑,可以使用一些帮助。谢谢。

0 投票
1 回答
6083 浏览

r - “环境”类型的 R 对象不可子集

我正在使用区间删失数据进行生存分析,并且正在尝试使用 incox 包中的 intcox() 函数进行 Cox 回归。我已经用 survfit() 完成了部分分析,一切正常。

当我尝试使用 intcox 时,总是有一个问题:

dados$sexo 是一个具有三个级别的因子,dados 是一个包含 156 个观察值和 52 个变量的列表。在进行 Kaplan-Meier 分析或在没有区间数据的情况下使用 coxph() 时没有问题。当我使用其他变量时,问题似乎是一样的。
我正在使用 R 3.0.1

**更新**
我没有改变任何东西,现在错误看起来像这样:

0 投票
2 回答
1262 浏览

r - 如何在 Kaplan-Meier 曲线中预测给定时间的 y 值

在 Kaplan-Meier 曲线中,如何预测给定时间的y值。

0 投票
1 回答
371 浏览

r - 没有似然比检验的 intcox() 输出

我正在使用区间截断数据进行生存分析,并且我正在使用 R 中 intcox 包中的 intcox() 函数,该函数基于 coxph 函数。

该函数返回没有似然比测试值的输出:

我不知道为什么会这样……这是 coxph() 函数对相同数据的应用:

你能帮我解决这个问题吗?
提前致谢。

0 投票
0 回答
713 浏览

r - R中生存分析中MTTF的置信区间

对于不同的测试条件(电压),我必须评估存在辐射的电气设备的 MTTF。
对于每个电压,我只能测试几个单元(通常为 5 个),失败的单元数量范围从 0(低电压)到可能 5(高电压)。
因此,这是一个可能具有非常高的“正确”审查的生存分析案例(例如,在辐照结束时,可能只有一个单元发生故障,其他 4 个单元会正常)。我不是统计学家,所以想请教一下。

我正在使用 R 和“生存”包来处理数据。根据我的理解,R 计算 Kaplan-Meier 估计量并尝试将得到的经验分布拟合到 Weibull 故障模型(我正在使用带有 dist="weibull" 的 survreg,这是此类设备的故障模型)

我的问题:

我可以计算 MTTF(我使用 Weibull 分布的平均值和 Weibull 拟合产生的参数),但我有点迷失了获得 MTTF 的 95% 置信区间。
应用于 survreg(...) 的返回的 vcov() 函数提供了 Weibull 参数的方差和协方差,但我认为由于未集成的 Kaplan-Meier 估计量(参见:Greenwood 公式)存在额外的不确定性到整个事情。

我不知道如何将所有部分放在一起;R(在生存包或其他地方)有设施来实现这一点吗?或者您能否提供有关如何集成所有错误源的指南?