我正在尝试拟合生存曲线,并且发生了其他数据集没有发生的不寻常的事情。当我尝试绘制曲线时,我得到两条曲线,每条曲线都有一个 CI。通常我有以下数据摘要:
> summary(fit1)
Call: survfit(formula = Surv(Day, Status) ~ 1, data = d1)
time n.risk n.event survival std.err lower 95% CI upper 95% CI
1 1940 16 0.992 0.00205 0.988 0.996
2 1924 5 0.989 0.00235 0.985 0.994
3 1919 5 0.987 0.00261 0.981 0.992
4 1914 3 0.985 0.00276 0.980 0.990
5 1911 1 0.985 0.00280 0.979 0.990
6 1910 2 0.984 0.00289 0.978 0.989
8 1908 4 0.981 0.00306 0.975 0.987
11 1904 3 0.980 0.00319 0.974 0.986
14 1901 1 0.979 0.00323 0.973 0.986
18 1900 1 0.979 0.00327 0.972 0.985
对于不同的数据集,我得到两条曲线,摘要看起来完全不同。如何选择仅绘制其中一条曲线?我使用自动绘图来绘制它们。这是摘要:
> summary(fit10)
Call: survfit(formula = Surv(Day, Status) ~ Symptomatic, data = d2)
2 observations deleted due to missingness
Symptomatic=N
time n.risk n.event P((s0)) P(1)
1 985 2 0.998 0.00203
2 983 2 0.996 0.00406
3 981 3 0.993 0.00711
4 978 2 0.991 0.00914
6 976 1 0.990 0.01015
8 975 3 0.987 0.01320
11 972 2 0.985 0.01523
Symptomatic=Y
time n.risk n.event P((s0)) P(1)
1 955 14 0.985 0.0147
2 941 3 0.982 0.0178
3 938 2 0.980 0.0199
4 936 1 0.979 0.0209
5 935 1 0.978 0.0220
6 933 1 0.977 0.0230
8 932 1 0.976 0.0241
11 931 1 0.975 0.0251
14 930 1 0.974 0.0262
18 928 1 0.973 0.0272
为什么我不能将 ggsurvplot 用于第二个数据集 (d2)?这是错误消息:
> ggsurvplot(fit10)
Error in data.frame(..., check.names = FALSE) :
arguments imply differing number of rows: 26, 0, 52