问题标签 [catboostregressor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
40 浏览

catboost - 为什么 catboost 中两个相同功能的重要性不同

我使用一些功能制作了一个 catboost 模型。

两个特征完全相同。

.

catboost 的结果,一个特征的重要性是 26%,而其他的重要性是 7%。

相同的功能但不同的重要性。

为什么?

0 投票
1 回答
44 浏览

catboost - Predicting probabilities in CatBoost regressor

Does CatBoost regressor have a method to predict the probabilities of each prediction? I see one for CatBoost classifier (https://catboost.ai/en/docs/concepts/python-reference_catboostclassifier_predict_proba) but not for regressor.

0 投票
0 回答
11 浏览

catboost - CatBoost 如何在回归中编码分类变量?

CatBoost 在其文档中指出,在回归任务中对分类变量进行编码时,量化应用于目标变量。基本上我们将目标分箱到 k 个箱中。CatBoost 中是否有选择 bin 数量的参数?没找到,如果没有这个参数,CatBoost怎么选k?我指的文件是:

将分类变量转换为数值格式

量化

0 投票
0 回答
14 浏览

categorical-data - CatBoost 如何在测试集上编码分类变量?

从 CatBoost 的论文和文档中,我可以理解它如何在训练集上对分类变量进行编码。但是分类变量如何在测试集中编码是一个谜。我在他们的 GitHub 上看到了一些与此相关的问题,但同样不够详细,无法理解和实施。我认为目标平均编码是在训练集上完成的,并且测试集中的级别被替换为这些值。但这不是合法信息,我需要对此进行详细回答。任何人都知道编码是如何在测试集中进行的?