我有两个数据集(训练和验证)用于构建和验证 Cox 模型。
使用训练数据集,我使用逐步选择方法拟合了 cox 模型。
模型中的重要变量是验证模型中包含的唯一变量。这是正确的方法吗?
在验证模型时,我意识到变量在验证模型中并不重要,并且 cox 模型的假设也不成立(我检查了验证数据的假设)。我是否应该忽略变量微不足道的事实并继续纠正验证数据中模型假设的问题?
第三,在训练和验证数据中,我对三组进行了变量“治疗”。在训练中,组是标准、新药和混合,而在验证数据中,组是标准、新药和 X(这是一种不同于训练数据中混合的治疗方法)。在两个模型中都包含这个变量是否正确,或者我应该消除不匹配的组;来自训练数据和来自验证数据的 X 的混合物,还是我应该这样使用它?我不确定这会如何影响我的分析。
感谢您的回复。