1

我是 CatBoost 的新手,我正在使用logging_level = "Info". 我的数据由分类变量和数值变量组成。

首先,对于其中一个分类变量,我在打印的信息中收到以下消息:feature 21 is redundant categorical feature, skipping it. 这个特征的冗余度是如何确定的?

此外,对于迭代的所有信息代表什么,我有点迷茫。这是我的一次训练迭代的信息输出:

{Feature1} pr0 tb1 type0, border=10 score 2.001737609
Feature2, bin=40 score 2.867480488
{Feature3, Feature2 b40} pr2 tb2 type0, border=6 score  3.533462883
Feature4, bin=5 score 4.105045044
46: learn: -1.2759319   total: 13.2s    remaining: 843ms

在这种情况下,Feature1 和 Feature3 是分类的,而 Feature2 和 Feature4 是数值的。

pr0, tb1,type0等所有值score代表什么?任何指向文档的指针将不胜感激。

4

0 回答 0