LightGBM 支持分类变量。我想知道它是如何对它们进行编码的。它似乎不是一种热编码,因为该算法非常快(我尝试使用一种热编码花费大量时间的数据)。
问问题
7365 次
1 回答
1
https://github.com/Microsoft/LightGBM/issues/699#issue-243313657
The basic idea is sorting the histogram according to it's accumulate values (sum_gradient / sum_hessian), then find the best split on the sorted histogram, just like the numerical features.
于 2018-08-04T14:54:48.327 回答