我正在研究具有 5 个已知组的用户分类(观察结果大致均等地分布在组中)。我有关于这些用户的信息(比如年龄、居住区域......),并尝试找到识别每个组中用户的特征。
为此,我使用 R 中的 Rweka 包(机器学习算法集合:http ://cran.r-project.org/web/packages/RWeka/RWeka.pdf )。为了找到区分我的组的特征,我使用逻辑模型树 (LMT)。关于这个函数的信息很少:
- 我将尝试绘制一个绘制树的示例。拆分很容易解释,但在每个终端节点中都有一个填充有:
LM_24:48/96
(20742)
这是什么意思?如何查看节点在五个组中的哪一个结束?
- 使用什么函数可以检索模型中使用的系数?这样就可以研究变量的影响。
(我确实研究了在这些数据上构建树的其他方法,但回归和分类树包(如 rpart、party)都只在我的数据中找到一个终端注释,而 LMT 函数找到 6 个拆分节点)
我希望你能为我提供这个功能的答案/一些帮助。非常感谢!