问题标签 [survival]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
44 浏览

r - 如何识别一组有序列中的第一个零?

我正在尝试格式化数据集以用于某些生存分析模型。每行是一所学校,时变列是当年该校在校学生总数。假设数据框看起来像这样(也有时间不变的列)。

我想创建一个新列,指示学校何时“死亡”,即出现零的第一列。最终,我希望这个专栏是“自 1989 年以来的年份”,并且可以相应地重新命名专栏。

该问题的更一般版本,对于一系列时间排序的列,我如何识别出现给定值的第一列?

0 投票
0 回答
139 浏览

r - 不同时间点的生存分析

我正在对一个非常大的数据集进行生存分析,并试图检查特定变量在不同时间点(30 天、90 天、180 天、365 天)对生存的影响。

我想运行单变量 Cox 回归,但我不确定如何正确执行此操作。数据集包含一个变量“时间”,其中包含患者在数据集中出现的天数。

起初,我只是在不同的时间点做了一个主要数据集的子集(即 Time <= 30 的子集......等),然后在每个数据帧中运行一个简单的 Cox 回归(coxph(surv(time, event)~x)......这显然是愚蠢,因为它只包含导致每个间隔的信息。我不知道如何解决这个问题,并且无法通过我的搜索找到一个好的答案

任何建议将不胜感激。谢谢你!

0 投票
0 回答
23 浏览

graph - SAS:地块编号仍然存在 # 天

给定具有事件天数和结果的数据,如下所示:

为每个结果生成曲线的最简单方法是什么,该曲线显示第 X 天仍在观察的样本比例,按结果细分?

我试过了:

当结果为“tx end”或“death”时,“censored”设置为 1。我非常喜欢产生的产品极限生存曲线,除了死亡线和 tx 结束线完全平坦,y = 1.0。

我实际上根本不想在这里做任何推断——只是想要漂亮的图片。有没有简单的方法?

0 投票
1 回答
126 浏览

r - Fine&Gray 竞争风险调整模型 (FGR) 中的固定系数/偏移量

我想拟合一个 Fine&Gray 竞争风险调整模型,包括抵消。在其他类型的模型中,我习惯于简单地输入 >offset(x),这将添加一个系数为 1 的偏移量。我尝试使用包 riskRegression 中的 FGR 函数来做同样的事情。我没有收到警告消息,但随后我注意到带有和不带有 offset(x) 的模型的系数对于其他变量完全相同

例子:

如果您运行此脚本,您可以看到 a、y 和 z 的系数没有改变,而您没有收到无法使用偏移量的警告(因此显然它只是简单地忽略了 offset(x))。

有人知道在 FGR 中包含 x 作为偏移量(即系数固定为 1)的方法吗?(编辑:或者另一种方法来计算具有固定 x 的 a、y 和 z 的正确系数?)

0 投票
1 回答
300 浏览

r - 具有交互变量的非比例危害 (Cox) 模型的计数过程数据集

如Singer 和 Willett的Applied Longitudinal Data Analaysis第 15 章(第 15.3 节)所述,我正在尝试运行一个非比例 cox 回归模型,该模型具有与时间的相互作用变量。但是,我似乎无法得到与这本书一致的答案。

本书中使用的数据和源代码都在这个奇妙的网站上提供。不幸的是,最后一章没有提供 R 代码,并且为文本中讨论的示例提供的 R 数据集不完整,并且为最简单的模型(我知道如何运行)提供了不正确的答案。相反,要获取此示例的完整数据集,必须单击“SAS”列中的“下载”链接(具有正确的数据集),然后在安装haven包后(允许读取外国数据格式) ,通过以下方式读取相关数据集:

haven::read_sas("alda/lengthofstay.sas7bdat")

该数据集表示参与者在医院住院治疗中的(变量)住院ID时间(变量)。DAYS审查变量是CENSOR。研究人员假设两种不同类型的治疗(二元变量TREAT)可以预测检查出治疗风险的差异值。此外,他们预计组间的危险差异不会随着时间的推移而保持不变,因此需要创建一个交互项。我可以让简单的主效应模型工作,返回书中报告的相同危险系数(这就是我最终发现 R 代码提供的 .csv 文件不完整的原因)。

summary(modA <- coxph(Surv(DAYS,1-CENSOR) ~ TREAT, data = los))

我尝试遵循此处此处列出的程序以及其中列出的来源(例如,Therneau vignette on time-variable covariates on the survivalpackage),当然,当我复制粘贴其他人的代码并运行它时一切正常。但是我正在尝试使用一个数据集从头开始为自己做这件事,我可以将其结果与我的结果进行比较。而我就是无法让它发挥作用。

首先我创建了一个 EVENT 变量

los$EVENT <- 1 - los$CENSOR

数据集中存在导致问题的重复 ID 号。所以我们必须将其更改为新的ID号

los$ID[which(duplicated(los$ID))] <- 842

现在,根据我在此处此处阅读 的内容,需要拆分数据框,以便对于每个参与者,当任何其他参与者经历事件EVENT时,在他们的事件(或审查)时间之前的每个时间点都有一行指示状态。因此,我们需要创建一个包含所有唯一事件时间的向量,然后在这些事件时间上拆分数据集

当我查看这个数据集时,它似乎就是我所追求的,(1)每个参与者的行数与数据集中其他人经历事件的事件时间之前的间隔一样多,(2)两列表示每个间隔的下限和上限,以及 (3) 事件列,当受访者没有经历事件时,所有行的所有行都为 0,当他们经历事件或被审查时,最后一行为 1。

接下来,我创建了与时间的交互变量,从“间隔上限”列中减去 1,以便主效应TREAT代表住院第一天的治疗效果。

并运行模型

但它不起作用!我收到了(相当无用的)错误消息

我究竟做错了什么?近三年来,我一直在慢慢地通过 Singer 和 Willett 工作(我还是研究生时开始的),现在最后一章被证明是迄今为止我最大的挑战。我还有三十页要写;任何帮助将不胜感激。

0 投票
1 回答
49 浏览

r - Providing dataframe and columns in separate arguments

I know how to draw survival curves (made by survival package) by autoplot from ggfortify. Here I use ovarian data frame, also from survival package.

It's possible to provide survfit function with column names only and specify data frame separately, as follows:

This works nicely. What I would like to do is wrap it into my own function with data argument at the beginning, so that I could use pipes and filter my dataframe beforehands, without having to create gazillions new dataframes.

This is the function:

Calling it however raises an error:

Am I missing something?

0 投票
1 回答
399 浏览

r - 使用右分和左截断 + 右分观察创建生存对象

我在 R 中创建生存对象时遇到问题。我想对订阅客户的生存情况(每月数据)进行建模,但是为了创建生存对象,我需要合并两种类型的审查:

  • 经典的右删:部分客户进入观察期尚未退订(“死亡事件”)

  • 左截断和右删失:其他客户在观察期之前进入但不知道是什么时候,因为之前没有历史表

当然我有事件案例(取消订阅)。但对我来说,问题是如何在同一数据集中生成两种类型的生存对象,然后进行建模。我认为不考虑“截断”的情况会偏见和低估一些客户留下的时间,所以我不想丢弃这些案例。

因此,我知道那些进入观察期的人的开始时间。但是对于那些之前进入的人,我只是将句点“0”作为他们的开始时间,而不是真实的(未知数)。

到目前为止,我已经尝试过以下代码:

提前感谢您的帮助。

0 投票
0 回答
293 浏览

r - 时间相关的 Cox 模型

考虑附加的(虚拟)样本 csv 文件,其中使用两种方法(即方法 A 和方法 B)来评估癌症患者的进展时间 (PFS)。对于每位患者,我们还有总生存期 (OS)。

在此处输入图像描述

从此处以 CSV 格式提供的数据

我想调查的是方法 A 或 B 的 PFS 是否能更好地预测患者的总体存活率。

我考虑了两个 Cox 模型,其中 PFS(方法 A 或 B)作为时间相关协变量(使用 coxph)包含在内,然后比较两个模型的性能,例如使用 C-index 或 Brier 分数(例如使用 pec 库)。这种方法合理吗?

不幸的是,我已经在努力正确设置所需的数据框(因为尽管相关列中的疾病进展与基础数据不对应,但通过 tmerge 生成的 methodA 或 B 列包含 NA 值):

您的帮助和意见将不胜感激。谢谢你。

0 投票
0 回答
436 浏览

r - 计算生存回归模型的风险比的置信区间

我试图获得survreg()功能风险比的置信区间,但它不像 coxph 那样简单。

比例固定为 1

指数分布 Loglik(model)= -4628.6 Loglik(intercept only)= -4736.1 Chisq= 215 on 5 个自由度,p= 0 Newton-Raphson 迭代次数:5 n=917(由于缺失而删除了 28 个观测值)

结果没有CI,只有标准差,所以我的问题是如何将AFT系数的SE转换为PH系数,然后计算HR的CI。

我有点卡在这里。有人可以帮忙吗?

0 投票
0 回答
134 浏览

r - 使用 mlr 包在 R 中使用时变协变量进行生存分析

是否可以像https://cran.r-project.org/web/packages/survival/vignettes/timedep.pdf中描述的方法一样,使用 mlr 包在生存分析中实现时变协变量?