3

LightGBM 支持分类变量。我想知道它是如何对它们进行编码的。它似乎不是一种热编码,因为该算法非常快(我尝试使用一种热编码花费大量时间的数据)。

4

1 回答 1

1

https://github.com/Microsoft/LightGBM/issues/699#issue-243313657

The basic idea is sorting the histogram according to it's accumulate values (sum_gradient / sum_hessian), then find the best split on the sorted histogram, just like the numerical features.

于 2018-08-04T14:54:48.327 回答