0

我有一个关于生存分析的问题。但是,我有以下数据(只是摘录):

在此处输入图像描述

现在我正在尝试使用 Python 生命线包进行生存分析。例如,我想了解 T 细胞是否会影响总体存活率 (OS)。但据我所知,我需要将 T 细胞的数量分类为不同类别,例如高 T 细胞和低 T 细胞……对吗?但是我如何找到最合适的 Cut-Out?我的计划是证明,具有高 T 细胞的肿瘤比低 T 细胞具有更好的存活率。但是我怎么能从我这里的数据中找到区分高 T 细胞和低 T 细胞的最佳截止值。

有人有想法吗?我的一个朋友谈到了“ROC”-Analysis,但我现在真的很困惑......我会很高兴有任何帮助!

4

1 回答 1

1

连续变量到分类变量的转换远非显而易见。第一种方法可以基于现有文献,尤其是在医学/生物学方面。对现有文献的回顾可能足以创建这些类。另一种方法可以基于 T 细胞变量的经验分布,有时会突出“明显”的分类。使用 ROC 曲线可能是个好主意,但不知何故我认为没有必要。有必要在 Kaplan-Meier 类型生存分析中对变量进行分类,但如果您使用Cox 模型没有必要对这个变量进行分类。因此,我建议您使用 Cox 回归进行生存分析。Cox 回归将允许您在建模中添加多个预测变量以及交互项,这更方便。

于 2021-05-19T12:44:42.800 回答