我将 catboost 用于具有分类数据的多分类任务。我正在检查 ctr 的默认参数,即从分类数据到数值数据的转换。据说ctr的默认值为“None”。
据我了解,这是一个可选步骤。
该算法确实在我的数据集上工作,所以我想知道它是否使用:
- Gradient Boosting 属性来理解分类数据
- 还是它实际上使用了 Borders、Buckets、BinarizedTargetMeanValue、Counter 中的默认方法
- 或者它是否使用示例中给出的公式avg_target = (countInclass + prior) / (totalcount +1) 默认情况下看起来像“Buckets”