-1

我正在randomForest为我的数据训练包中的随机森林模型。有些变量属于字符类。我很确定randomForest只会将因子和数字类作为输入。所以我认为 R 会自动将字符强制转换为数字。

为了让我知道这可能如何影响我的建模结果,有谁知道 R 如何自动将字符强制转换为数字类(如算法/规则)?或者我可以查看的任何源代码?

我正在使用 R 版本 4.0.1。

提前致谢。

更新: 我检查使用

getTree(mod,1,labelVar=TRUE)

而且我可以看到,如果将这些字符变量转换为因子,那么输出中的“分割点”是一个整数(这意味着它是一个分类变量(参见:https ://www.rdocumentation.org/packages/randomForest /versions/4.6-14/topics/getTree ))。但是如果不转换为因子,那么输出中的“分割点”就不是整数。

所以我猜是 R 将这些字符变量的值强制转换为数值?但是怎么做?

4

1 回答 1

0

现在不确定R中的随机森林,但我有点相信,它只需要factors。如果它也需要characters,它会将它们转换为因子,而不是数字。

R中没有从字符到数字的明确转换。

于 2020-06-29T10:00:14.077 回答