我是 CatBoost 的新手,我正在使用logging_level = "Info"
. 我的数据由分类变量和数值变量组成。
首先,对于其中一个分类变量,我在打印的信息中收到以下消息:feature 21 is redundant categorical feature, skipping it
. 这个特征的冗余度是如何确定的?
此外,对于迭代的所有信息代表什么,我有点迷茫。这是我的一次训练迭代的信息输出:
{Feature1} pr0 tb1 type0, border=10 score 2.001737609
Feature2, bin=40 score 2.867480488
{Feature3, Feature2 b40} pr2 tb2 type0, border=6 score 3.533462883
Feature4, bin=5 score 4.105045044
46: learn: -1.2759319 total: 13.2s remaining: 843ms
在这种情况下,Feature1 和 Feature3 是分类的,而 Feature2 和 Feature4 是数值的。
pr0
, tb1
,type0
等所有值score
代表什么?任何指向文档的指针将不胜感激。