问题标签 [catboostregressor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
catboost - 为什么 catboost 中两个相同功能的重要性不同
我使用一些功能制作了一个 catboost 模型。
两个特征完全相同。
.
catboost 的结果,一个特征的重要性是 26%,而其他的重要性是 7%。
相同的功能但不同的重要性。
为什么?
catboost - Predicting probabilities in CatBoost regressor
Does CatBoost regressor have a method to predict the probabilities of each prediction? I see one for CatBoost classifier (https://catboost.ai/en/docs/concepts/python-reference_catboostclassifier_predict_proba) but not for regressor.
catboost - CatBoost 如何在回归中编码分类变量?
CatBoost 在其文档中指出,在回归任务中对分类变量进行编码时,量化应用于目标变量。基本上我们将目标分箱到 k 个箱中。CatBoost 中是否有选择 bin 数量的参数?没找到,如果没有这个参数,CatBoost怎么选k?我指的文件是:
categorical-data - CatBoost 如何在测试集上编码分类变量?
从 CatBoost 的论文和文档中,我可以理解它如何在训练集上对分类变量进行编码。但是分类变量如何在测试集中编码是一个谜。我在他们的 GitHub 上看到了一些与此相关的问题,但同样不够详细,无法理解和实施。我认为目标平均编码是在训练集上完成的,并且测试集中的级别被替换为这些值。但这不是合法信息,我需要对此进行详细回答。任何人都知道编码是如何在测试集中进行的?