目前我正在使用 R 中的glmtree()函数。我有一些具有 20 多个级别的因子变量。问题来自树的表示。由于某些变量中的大量级别(即 i_mode 有 29 个级别),某些叶子上的某些信息无法可视化。
一种可能的解决方案是“虚拟化”这些级别。但是,如果可能的话,我宁愿不这样做。
你知道我可以用一种更易读的形式表示同一个图的方法吗?
有什么线索吗?
谢谢
目前我正在使用 R 中的glmtree()函数。我有一些具有 20 多个级别的因子变量。问题来自树的表示。由于某些变量中的大量级别(即 i_mode 有 29 个级别),某些叶子上的某些信息无法可视化。
一种可能的解决方案是“虚拟化”这些级别。但是,如果可能的话,我宁愿不这样做。
你知道我可以用一种更易读的形式表示同一个图的方法吗?
有什么线索吗?
谢谢
我的感觉是,要理解这样的情节将是一个挑战,也超出了标签问题。就我个人而言,我会尝试将这样一个因素分解成更易理解的、层次更少的组(尽管不一定是二元的)。
话虽如此,在树中绘制边缘标签的面板函数edge_simple()
有一些参数可以帮助提高可读性,例如,您可以更改它们的位置并更改字体大小。有关工作示例,请参阅:
R partykit::ctree 边缘上的偏移标签
此外,您可以在学习树之前尝试缩写因子级别。然而,在 29 个关卡中,所有这些恐怕都无济于事。