我们通常对标称数据进行 one-hot 编码,以便更合理地计算特征之间的距离或权重,但我经常听说随机森林或 boosting 模型等基于树的模型不需要进行 one-hot 编码,但我在网上搜索过,不知道,谁能告诉我为什么或指导我一些材料弄清楚吗?
问问题
1303 次
我们通常对标称数据进行 one-hot 编码,以便更合理地计算特征之间的距离或权重,但我经常听说随机森林或 boosting 模型等基于树的模型不需要进行 one-hot 编码,但我在网上搜索过,不知道,谁能告诉我为什么或指导我一些材料弄清楚吗?