我想学习一个具有合理离散目标属性的决策树,该属性具有 5 个可能的不同值。但是,有一些离散的高基数输入属性(1000 种不同的可能字符串值),我想知道包含它们是否有意义。在包含一个属性来训练决策树时,最大基数应该是多少?
问问题
1065 次
我想学习一个具有合理离散目标属性的决策树,该属性具有 5 个可能的不同值。但是,有一些离散的高基数输入属性(1000 种不同的可能字符串值),我想知道包含它们是否有意义。在包含一个属性来训练决策树时,最大基数应该是多少?