我正在randomForest
为我的数据训练包中的随机森林模型。有些变量属于字符类。我很确定randomForest
只会将因子和数字类作为输入。所以我认为 R 会自动将字符强制转换为数字。
为了让我知道这可能如何影响我的建模结果,有谁知道 R 如何自动将字符强制转换为数字类(如算法/规则)?或者我可以查看的任何源代码?
我正在使用 R 版本 4.0.1。
提前致谢。
更新: 我检查使用
getTree(mod,1,labelVar=TRUE)
而且我可以看到,如果将这些字符变量转换为因子,那么输出中的“分割点”是一个整数(这意味着它是一个分类变量(参见:https ://www.rdocumentation.org/packages/randomForest /versions/4.6-14/topics/getTree ))。但是如果不转换为因子,那么输出中的“分割点”就不是整数。
所以我猜是 R 将这些字符变量的值强制转换为数值?但是怎么做?