问题
给定具有和变量(除其他外)的n患者记录,我想获得他们在他们所处的时间段内的生存风险,即 2、4、6、8、10 年。time
status
我有 24 - 47 个月(2 年)、48 - 83 个月(4 年)、84 - 107 个月(6 年)、108 - 119 个月(8 年)和 120 个月的部门——“最多可用”个月(10年)。
从个人的角度来看,一个生存月数为 30 个月的患者将被包括在两年期间内,并且与其他预测变量一起,我想知道该患者在两年内的生存风险。
我的方法
我正在使用此线程中描述的 R 代码检索我的数据的生存风险百分比。
km <- survfit(Surv(time, status)~1, data=mydata)
survest <- stepfun(km$time, c(1, km$surv))
time
变量是生存月份,具有status
值1
和0
分别代表活着和死去。
代码输出如下内容(取自此处):
> survest(0:100)
[1] 1.0000000 0.9854015 0.9781022 0.9708029 0.9635036 0.9635036 0.9635036
[8] 0.9416058 0.9124088 0.9124088 0.8978102 0.8905109 0.8759124 0.8613139
[15] 0.8613139 0.8467153 0.8394161 0.8394161 0.8175182 0.8029197 0.7883212
[22] 0.7737226 0.7664234 0.7664234 0.7518248 0.7299270 0.7299270 0.7225540
[29] 0.7225540 0.7151810 0.7004350 0.6856890 0.6856890 0.6783160 0.6783160
我的问题是:这些是我需要使用的 300,000 条个人记录的实际生存估计survest(0:300000)
吗?我尝试过survest(0:1000)
,但结果已经收敛到某个值,这并不能解决我的问题。