我在理解和在 Python 中应用决策树进行生存分析时遇到问题。我有一个数据集,其中包含变量年龄、体重、肿瘤大小、体积……(所有浮点数),我想知道是否与总体存活率相关(也是浮点数)。
但是我该如何应用决策树呢?在文献中,我只看到了 y_train 必须是分类变量(例如 0 或 1,良性或恶性,...)的示例,但它不适用于浮点数等连续变量。
但是,我想创建一个决策树,以便最终您可以发现肿瘤大小 > xx 且体积 > yy,您的预测总生存期约为 < zzz。
有人可以帮我解决我的问题吗?有谁知道在哪里可以阅读有关此主题的更多信息?