我在 R 中建立了一个扩展的 Cox 模型,其中包含一个与时间相关的协变量 X1(X2-X7 是时间无关的)
coxph(Surv(start, stop, status) ~ X1 + X2 + ... + X7, data = data).
为了将这个与时间相关的变量包含到模型中,我以“(开始,停止)样式”创建了数据集,它将最初的大约 1500 个观察值扩展到大约 2500 行。
subjid start stop status X1 X2 X3 X4 X5 X6 X7
1 0.000000 15.572895 1 0 Y Y Y Y 1 10
2 0.000000 4.501027 1 0 Y Y Y Y 1 15
3 0.000000 13.930185 0 0 Y Y N N 1 30
3 13.930185 17.117043 0 1 Y Y N N 1 12
3 17.117043 34.036961 0 0 Y Y N N 1 7
4 0.000000 26.381930 1 0 Y Y Y Y 0 3
5 0.000000 5.880903 0 0 Y N N N 1 22
5 5.880903 9.067762 0 1 Y N N N 1 1
5 9.067762 12.188912 1 0 Y N N N 1 11
6 0.000000 16.164271 1 0 Y N N Y 1 12
对于多达 1300 次观察,代码可以正确执行(即使包含超过 1000 次观察需要很长时间)。包括更多观察会导致软件 R 无响应(我等待了大约 5 个小时让程序给我结果,但它一直冻结)。这与 R coxph 帮助网站上“关系”下的声明一致 ( http://stat.ethz.ch/R-manual/R-patched/library/survival/html/coxph.html )。但是,我无法减少我的样本量(即我的数据集),因此我正在寻找其他建议,我可以如何让这个代码运行(更快)。
谢谢,艾莉