1

我将 catboost 用于具有分类数据的多分类任务。我正在检查 ctr 的默认参数,即从分类数据到数值数据的转换。据说ctr的默认值为“None”。

据我了解,这是一个可选步骤。

该算法确实在我的数据集上工作,所以我想知道它是否使用:

  • Gradient Boosting 属性来理解分类数据
  • 还是它实际上使用了 Borders、Buckets、BinarizedTargetMeanValue、Counter 中的默认方法
  • 或者它是否使用示例中给出的公式avg_target = (countInclass + prior) / (totalcount +1) 默认情况下看起来像“Buckets”
4

1 回答 1

0

在 Multiclass CatBoost 中,使用 Buckets 方法计算 ctrs。

你写的公式是正确的。为每个类计算一个单独的 ctr 特征。这里的 countInClass 是在随机排列中给定一个之前具有相同类别值的对象的计数,这些对象具有此类值。totalCount 是之前给出的具有相同类别值且具有任何类值的对象的数量。

于 2018-02-08T20:39:49.853 回答