问题标签 [cox-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cross-validation - 使用外部数据的生存模型验证
我有两个数据集(训练和验证)用于构建和验证 Cox 模型。
使用训练数据集,我使用逐步选择方法拟合了 cox 模型。
模型中的重要变量是验证模型中包含的唯一变量。这是正确的方法吗?
在验证模型时,我意识到变量在验证模型中并不重要,并且 cox 模型的假设也不成立(我检查了验证数据的假设)。我是否应该忽略变量微不足道的事实并继续纠正验证数据中模型假设的问题?
第三,在训练和验证数据中,我对三组进行了变量“治疗”。在训练中,组是标准、新药和混合,而在验证数据中,组是标准、新药和 X(这是一种不同于训练数据中混合的治疗方法)。在两个模型中都包含这个变量是否正确,或者我应该消除不匹配的组;来自训练数据和来自验证数据的 X 的混合物,还是我应该这样使用它?我不确定这会如何影响我的分析。
感谢您的回复。
r - 如何使用控制变量在 R 中运行生存分析?
在 RI 中,可以使用生存包中的 coxph 来拟合生存时间(time
和event
)和自变量的 Cox 比例风险模型stat
,但我不知道如何控制可能的影响,比如说,pol
除了将其包含在模型作为另一个自变量。以下是两个模型,一个有控制变量,一个没有控制变量。
具有独立 ( stat
) 和控制变量 ( pol
)的第二个模型
使用 R 生存包将 cox 比例风险模型与控制变量拟合还有哪些其他想法?
r - 具有时变依赖性的 Cox PH 建模和预测
我对 coxph() 和 predict(Surv()) 的使用有一些疑问。我知道我的问题有点长,也许我没有很好地解释自己,但任何意见或建议都值得赞赏。
我正在尝试为房屋屋顶维修制作 Cox PH 模型和预测。我有 5 个输入变量(协变量):
House_Age(也称为开始)、House_Price、Roof_Material_Grp_New、Land_Ownership_Status_Grp、Living_Status_Grp
顾名思义,前两个是数字变量,后三个是分类变量。我的问题是我想让 House_Age 危险取决于时间。我选择对 House_Age 的每三年进行一次“数据拆分”(因此 House_Age 变成变量 Start)——例如,在 7 年后发生事件的情况下,数据看起来像
Start 等于 House_Age。正如我在对 Start 组的每个值的估计中看到的那样,直到大约 40 年似乎都存在线性相关性,因此我选择了最大 Start/House_Age 为 40 和线性关系
该模型很好,Start 变量的线性系数为 0.1916,指数值为 1.211 coef exp(coef) se(coef) z Pr(>|z|)
Start 1.916e-01 1.211e+00 6.817e-03 28.112 < 2e-16 ***
从孤立的 Start/House_Age 来看,危险每年增加 21% - 是否正确?我的问题是,现在我想预测 1、5 和 10 年的“修复”概率。首先,我尝试使用 survfit 和零向量作为输入来找到基线风险函数
这里 Abt_Baseline 包含数字变量的零和组的零级组值。由此我发现时间=1、5 和 10(仅显示 1 年)的累积风险,并将其与使用 predict 函数找到的“lp”预测的指数相乘。
一年预测:
如果没有时间相关的输入,这将是可以的,但未来的危险会随着 Start (=House_Age) 变量的变化而变化。我知道 Start 的未来值(每年增加 1),所以我想我可以在预测期间以某种方式整合。所以我有两个主要问题:
- 这似乎是进行建模和(部分)预测的明智方式吗?
- 如果是 - 我如何在预测期内针对变化(增加)的 House_Age/Start 危险进行整合?
有谁能够帮我?
r - 问:如何用 R 中的最大检验统计量计算 Cox PH 模型中的 p 值?
我有兴趣根据最大检验统计量计算 Cox PH 模型中的 p 值,以获得非常稳健的估计。这个事情谁有经验?
我已经玩过包含 Firth 惩罚可能性的 R 包“coxphf”,但如果我选择 firth=FALSE 与在“生存”中使用标准 coxph 函数,它似乎给了我不同的系数和 p 值。
我不认为完全迷失了这一点,所以任何建议都会很有用。
谢谢!
r - coxph 命令中时间变换函数的默认值是多少?
简短介绍:
coxph
可以使用包的功能来估计 Cox 比例危害 (PH) 模型survival
。从这种类型的模型中获得合理结果的一个明显要求是风险是成比例的,即它们随着时间的推移是恒定的。如果某个变量不是这种情况,可以通过使该变量的系数随时间变化来解决。(现在它在技术上是一个扩展的 Cox 模型。)这是通过tt()
向该变量添加 并随着时间的推移指定一个函数来完成的(参见vignette("timedep", package = "survival")
第 19 页+)。
问题:
tt()
如果在没有指定函数的情况下使用哪个函数?
这是一个例子:
我们看到这ph.karno
违反了 PH 假设(小 p 值),所以添加tt()
:
现在满足 PH 假设,但我不知道该tt()
函数实际做了什么。我尝试了一些常用的功能,例如tt = function(x, t, ...) x*t
, tt = function(x, t, ...) x + t
, tt = function(x, t, ...) x*log(t)
。但都给出了不同的结果(并且无法修复 PH 违规)。
任何帮助表示赞赏。
sas - 在 Proc PHREG 中开发的编码模型
我已经使用 SAS proc phreg 程序开发了一个 COX 模型。我知道如何使用 proc 过程使用协变量进行评分。如何将模型转换为简单的 sas 代码?
谢谢。
r - 如何从 coxph 获得累积危险比的输出?
如何从 coxph 获得累积危险比的输出?
我有我的模型
并获得输出
hr = exp(-0.004140)
我知道我可以使用和手动计算危险比ci= exp(-0.004140-1.96*0.000905)
,exp(-0.004140+1.96*0.000905)
这将给我增加一个单位的置信区间的 HR。
是否有一个函数可以将结果作为矢量或 data.frame 给我?如果我可以定义感兴趣的单位的数量,比如
somefunction(coxfit, unit_step)
但只计算累积风险比就可以了
r - 在 r 中拟合时变 cox 模型
拜托,我在尝试适应时变 cox 模型时遇到了一些挑战。确切地说,在我阅读了使用 survSplit 命令的示例之后,我发现很难获得相同的结果。我最终遇到一个错误或其他错误,这是一个示例和错误消息。
注意:我的数据集最初没有标记为 start 的列。但是我看了会被命令创建,不知道这样对不对?
请问,有什么没有做正确的事情来得到正确的结果吗???还是有更好的方法来实现 survSplit 命令?
r - 在ggplot中绘制连续协变量的预测生存曲线
如何绘制 cox 比例风险模型中连续协变量的代表值的生存曲线?具体来说,我想在 ggplot 中使用“survfit.cox”“survfit”对象来执行此操作。
这似乎是一个已经回答的问题,但我已经用“survfit”和“newdata”(以及许多其他搜索词)这两个词搜索了 SO 中的所有内容。这是迄今为止最接近回答我的问题的线程:Plot Kaplan-Meier for Cox regression
与该帖子的答案之一中提供的可重复示例保持一致:
问题是,一旦我有了这个名为 的数据框survcurv
,我就无法判断哪个“估计”变量属于哪个模式,因为没有保留任何原始变量。例如,哪个“估计”变量代表 30 岁的拟合曲线,race = 'other',prio = '4',fin = 'no'?
在我见过的所有其他示例中,通常将 survfit 对象放入通用plot()
函数中并且不添加图例。我想使用 ggplot 并为每条预测曲线添加一个图例。
在我自己的数据集中,模型要复杂得多,曲线也比我在这里展示的要多得多,所以你可以想象看到 40 个不同的 'estimate.1'..'estimate.40' 变量很难理解什么是什么。
r - R中的coxph:if(any(infs))警告中的错误(paste(“Loglik在变量之前收敛”
我知道这是另一个线程中的类似问题。但是,我将建议的解决方案添加到我的代码中,但它仍然不起作用:
错误信息是:
我现在不想迷惑人们,所以如果您需要更多信息,请告诉我,也许是输入数据文件的摘要?!我只是完全不知道这个错误的原因是什么。
感谢您的帮助,非常感谢!
此致