问题标签 [survival-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 获得每个个体实例的 Kaplan-Meier 生存风险
问题
给定具有和变量(除其他外)的n患者记录,我想获得他们在他们所处的时间段内的生存风险,即 2、4、6、8、10 年。time
status
我有 24 - 47 个月(2 年)、48 - 83 个月(4 年)、84 - 107 个月(6 年)、108 - 119 个月(8 年)和 120 个月的部门——“最多可用”个月(10年)。
从个人的角度来看,一个生存月数为 30 个月的患者将被包括在两年期间内,并且与其他预测变量一起,我想知道该患者在两年内的生存风险。
我的方法
我正在使用此线程中描述的 R 代码检索我的数据的生存风险百分比。
time
变量是生存月份,具有status
值1
和0
分别代表活着和死去。
代码输出如下内容(取自此处):
我的问题是:这些是我需要使用的 300,000 条个人记录的实际生存估计survest(0:300000)
吗?我尝试过survest(0:1000)
,但结果已经收敛到某个值,这并不能解决我的问题。
r - coxph() X 矩阵被认为是奇异的;
我在使用 coxph() 时遇到了一些麻烦。我有两个分类变量:“tecnologia”和“pais”,我想评估“pais”对“tecnologia”的可能交互影响。“tecnologia”是一个具有 2 个级别的变量因子:gps 和 convencional。而“pais”分为 2 个级别:PT 和 ES。我不知道为什么这个警告不断出现。这是代码和输出:
我正在就这个主题提出另一个问题,尽管几个月前我提出了一个类似的问题,因为我再次面临同样的问题,还有其他数据。这次我确定这不是与数据相关的问题。
有人可以帮助我吗?谢谢
更新: 问题似乎不是一个完美的分类
r - 使用 R 进行条件逻辑回归(clogit 和 coxph)的 Rmpi
我正在尝试在具有多个节点的计算中心运行条件逻辑回归,以评估 9.69 亿行的大数据集。但是计算取消了,因为作业超过了最大容量节点的最大内存 90GB。
我听说 R 包“Rmpi”可以在多个节点上运行计算。
我正在使用以下代码运行条件 logit 回归:
是否可以使用 Rmpi 进行此计算,如果可以,我如何在代码中实现它?
我真的很感激任何帮助来解决这个问题。
非常感谢您提前。
r - R运行clogit中的“捕获段错误”和“内存未映射”
我正在尝试使用 R 中的以下脚本对 9 x 484995115 矩阵运行条件逻辑回归
但是在具有 256GB 内存的节点上计算 2 小时后,程序停止并显示以下错误消息:
这个错误的原因是什么?在计算期间从未超过内存容量。我可以在代码中进行哪些更改以避免此错误?
我真的很感激任何帮助来解决这个问题。
非常感谢您提前。
graph - 绘制多个双向函数时的不完整线
我正在使用 Stata 绘制多个函数。在这种情况下,我正在绘制不同的 Gompertz 生存函数;一岁30
一岁70
。
首先,考虑30
-岁:
如您所知,比例参数有一个常数 ( -3.520509
) 和年龄 ( 0.0762475
),而形状有一个常数 ( 0.0378969
)。
年龄以平均值为中心,这就是协变量为-34
( 64 - 34 = 30
) 的原因。
其次,考虑70
-岁:
两个函数单独绘制时都很好。
但是,当我绘制两者时,一条曲线没有完成:
你能帮助我吗?
r - R - 不包括因子水平的 cox 风险模型
我正在将 cox 模型拟合到一些结构如下的数据:
该RUTH.CLASS
变量实际上是一个因素,我已将其更改为一个因素:
伟大的。
拟合模型后
当我在模型中拟合更多变量时,会发生类似的事情:
model.matrix
从下面截断输出:
我们可以看到,每一个的第一级都被排除在模型之外。任何投入将不胜感激。我注意到在LESION.TYPE
变量上,""
没有包含空白级别,但这不是设计使然——应该是 aNA
或类似的东西。
我很困惑,可以使用一些帮助。谢谢。
r - “环境”类型的 R 对象不可子集
我正在使用区间删失数据进行生存分析,并且正在尝试使用 incox 包中的 intcox() 函数进行 Cox 回归。我已经用 survfit() 完成了部分分析,一切正常。
当我尝试使用 intcox 时,总是有一个问题:
dados$sexo 是一个具有三个级别的因子,dados 是一个包含 156 个观察值和 52 个变量的列表。在进行 Kaplan-Meier 分析或在没有区间数据的情况下使用 coxph() 时没有问题。当我使用其他变量时,问题似乎是一样的。
我正在使用 R 3.0.1
**更新**
我没有改变任何东西,现在错误看起来像这样:
r - 如何在 Kaplan-Meier 曲线中预测给定时间的 y 值
在 Kaplan-Meier 曲线中,如何预测给定时间的y值。
r - 没有似然比检验的 intcox() 输出
我正在使用区间截断数据进行生存分析,并且我正在使用 R 中 intcox 包中的 intcox() 函数,该函数基于 coxph 函数。
该函数返回没有似然比测试值的输出:
我不知道为什么会这样……这是 coxph() 函数对相同数据的应用:
你能帮我解决这个问题吗?
提前致谢。
r - R中生存分析中MTTF的置信区间
对于不同的测试条件(电压),我必须评估存在辐射的电气设备的 MTTF。
对于每个电压,我只能测试几个单元(通常为 5 个),失败的单元数量范围从 0(低电压)到可能 5(高电压)。
因此,这是一个可能具有非常高的“正确”审查的生存分析案例(例如,在辐照结束时,可能只有一个单元发生故障,其他 4 个单元会正常)。我不是统计学家,所以想请教一下。
我正在使用 R 和“生存”包来处理数据。根据我的理解,R 计算 Kaplan-Meier 估计量并尝试将得到的经验分布拟合到 Weibull 故障模型(我正在使用带有 dist="weibull" 的 survreg,这是此类设备的故障模型)
我的问题:
我可以计算 MTTF(我使用 Weibull 分布的平均值和 Weibull 拟合产生的参数),但我有点迷失了获得 MTTF 的 95% 置信区间。
应用于 survreg(...) 的返回的 vcov() 函数提供了 Weibull 参数的方差和协方差,但我认为由于未集成的 Kaplan-Meier 估计量(参见:Greenwood 公式)存在额外的不确定性到整个事情。
我不知道如何将所有部分放在一起;R(在生存包或其他地方)有设施来实现这一点吗?或者您能否提供有关如何集成所有错误源的指南?