我正在根据来自Kaggle的心脏病数据训练决策树模型。
由于我还在使用 10 倍 CV 构建其他模型,因此我尝试使用 caret 包和 rpart 方法来构建树。然而,情节结果很奇怪,因为“铊”应该是一个因素。为什么它显示“thaliumnormal <0.5”?这是否意味着如果“铊”== 正常“然后走左边的路线“是”,否则走右边的路线“否”?
非常感谢!
编辑:我很抱歉没有提供足够的背景信息,这似乎造成了一些混乱。“铊”是一个变量,代表一种用于检测冠状动脉狭窄(又名狭窄)的技术。这是一个具有三个级别(正常、固定缺陷、可逆缺陷)的因素。
此外,我想让图表更具可读性,例如,而不是“thaliumnormal < 0.5”,它应该是“thalium = normal”。我可以通过直接使用 rpart 来实现这个目标(见下文)。
但是,您可能已经注意到树是不同的,尽管我使用了推荐的 cp 值和 caret rpart CV 10 folds(参见下面的代码)。
我了解这两个软件包可能会导致一些差异。理想情况下,我可以使用 caret 和方法 rpart 来构建树,以便它与 caret 中内置的其他模型对齐。有谁知道如何使用插入符号 rpart 构建的树模型的绘图标签更容易理解?




