2

我在 R 中建立了一个扩展的 Cox 模型,其中包含一个与时间相关的协变量 X1(X2-X7 是时间无关的)
coxph(Surv(start, stop, status) ~ X1 + X2 + ... + X7, data = data).

为了将这个与时间相关的变量包含到模型中,我以“(开始,停止)样式”创建了数据集,它将最初的大约 1500 个观察值扩展到大约 2500 行。

   subjid  start   stop  status  X1    X2     X3    X4       X5     X6   X7
       1  0.000000 15.572895      1  0     Y      Y     Y        Y      1    10
       2  0.000000  4.501027      1  0     Y      Y     Y        Y      1    15
       3  0.000000 13.930185      0  0     Y      Y     N        N      1    30
       3 13.930185 17.117043      0  1     Y      Y     N        N      1    12
       3 17.117043 34.036961      0  0     Y      Y     N        N      1    7
       4  0.000000 26.381930      1  0     Y      Y     Y        Y      0    3
       5  0.000000  5.880903      0  0     Y      N     N        N      1    22
       5  5.880903  9.067762      0  1     Y      N     N        N      1    1   
       5  9.067762 12.188912      1  0     Y      N     N        N      1    11 
       6  0.000000 16.164271      1  0     Y      N     N        Y      1    12

对于多达 1300 次观察,代码可以正确执行(即使包含超过 1000 次观察需要很长时间)。包括更多观察会导致软件 R 无响应(我等待了大约 5 个小时让程序给我结果,但它一直冻结)。这与 R coxph 帮助网站上“关系”下的声明一致 ( http://stat.ethz.ch/R-manual/R-patched/library/survival/html/coxph.html )。但是,我无法减少我的样本量(即我的数据集),因此我正在寻找其他建议,我可以如何让这个代码运行(更快)。

谢谢,艾莉

4

0 回答 0