问题标签 [catboost]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
801 浏览

python - 在 Catboost 中使用具有多类的 GPU

我正在尝试使用 catboost 来预测多类,但出现如下错误。

我使用了 catboost 选项,如下所示。

我想知道我是否可以使用 GPU 来预测多分类。

0 投票
1 回答
181 浏览

python-2.7 - CatBoost 和 UnicodeEncodeError

我正在尝试将 Python 2.7 和 CatBoostRegressor 与 Pandas 一起使用,但我得到了

UnicodeEncodeError:“ ascii”编解码器无法对位置 0-4 中的字符进行编码:序数不在范围内 (128)

我使用 unicode 三明治并将 csv 读取为: df = pd.read_csv ('out.csv', index_col = 0, encoding = 'utf8'). 读取数据后,我执行检查:

显然,Catboost 尝试进行编码,但没有成功。如何避免这种情况?

简化代码:

0 投票
1 回答
39 浏览

python - 如何同时使用多分类和回归?

有一个用于多分类和回归问题的混合数据集。分类的结果应该基于回归的结果。怎么做?

0 投票
1 回答
1942 浏览

r - 在 R 中使用插入符号保存和加载 catboost 模型

我能够使用插入符号(在 Rstudio 中)训练 Catboost 模型,并且效果很好。

如果我使用该模型在同一会话中预测新数据,没问题,它可以工作:

但是,如果我保存模型并稍后加载(或保存它,删除“my_catboost”并加载),函数 predict 将使 R 和 Rstudio 崩溃而没有错误消息,并且在 Rstudio 日志中找不到任何内容。加载后,我可以看到模型正在全局环境中创建,看起来很好。

我尝试了 R 函数保存和加载,saveRDS 和 readRDS 都崩溃了

谢谢 !

0 投票
1 回答
2153 浏览

python - CatBoost 中应用的贝叶斯优化

这是我在 CatBoost 中应用 BayesSearch 的尝试:

跟踪结果:

拟合贝叶斯CV

结果

前 3 次迭代工作正常,但随后我得到一个不间断的字符串:

(...)

关于我哪里出错/我该如何改进的任何想法?

致敬,

0 投票
0 回答
1548 浏览

python-3.x - catboost 上的 com 交叉验证和池问题

我在 mac (Python 3.6.3 | Anaconda) 中使用 catboost ,但模块cv(version = catboost-0.10.4.1 enum34-1.1.6)出现了一些问题(使用池的 cat_features 参数)。这是一个例子:

1) 一次性使用 catboost:

from catboost import CatBoostClassifier, cv,

model = CatBoostClassifier(early_stopping_rounds=30,cat_features = [0,1,2,3,4,5,6,7,8],iterations=2000,eval_metric='AUC',learning_rate=0.1,)

model.fit(X_train, y_train,eval_set=(X_test,y_test))

一切正常,我得到了输出!

2-) 当我尝试对 cv 模块使用基本相同的东西时,会出现问题:

输出 :

这些索引适用于分类变量(并且适用于单一拟合)。

我无法理解发生了什么,也找不到相关内容。有人可以帮忙吗?

0 投票
1 回答
99 浏览

python - catboost 是实现 xgboost(极端梯度提升)还是简单的梯度提升?

在他们的网站上,他们说“梯度提升”,但似乎这里的人们将其与其他“xgboost”算法进行了比较。我想知道它是否是一个真正的极端梯度提升算法。谢谢

0 投票
1 回答
200 浏览

machine-learning - 多CPU如何mlxtend StackingRegressor?

我想使用 mlxtend StackingRegressor 来集成 XGBoost、LGBM 和 Catboost 。但我不确定在这种方法中我将使用多少 cpu。

例如:

在 XGboost 中:

然后我知道我会用完这个算法中的所有cpu核心

但是如果我用 mlxtend StackingRegressor 试试呢?

我猜这个方法将使用我为每个算法安排的 cpu。

示例:XGBoost:2 LGBM:2 CatBoost:2 Meta regressor:1

所以最后我使用了 7 个核心。

0 投票
1 回答
414 浏览

machine-learning - 是否可以在 GPU 上运行 catboost predict?

我有一个需要在非常大的数据集上进行预测的用例。因此,与训练相比,预测所需的时间几乎是 10 倍。我想知道我是否可以使用 GPU 进行预测,或者它是否受 CPU 限制。我正在使用 EC2 P3.16x large(8x Tesla V100、64 VCPU)

0 投票
2 回答
2917 浏览

python - 如何将 catboosts 原始预测分数 (RawFormulaVal) 转换为概率?

对于 catboost 库中的某些对象(如 python 代码导出模型 - https://tech.yandex.com/catboost/doc/dg/concepts/python-reference_catboostclassifier_save_model-docpage/)预测(https://tech.yandex.com /catboost/doc/dg/concepts/python-reference_apply_catboost_model-docpage/)只会给出每条记录的所谓原始分数(参数值称为“RawFormulaVal”)。其他 API 函数还允许将预测结果作为目标类的概率 ( https://tech.yandex.com/catboost/doc/dg/concepts/python-reference_catboostclassifier_predict-docpage/ ) - 参数值称为“可能性”。

我想知道

  1. 这与概率有何关系(在二进制分类的情况下)和
  2. 是否可以使用python API(https://tech.yandex.com/catboost/doc/dg/concepts/python-quickstart-docpage/)将其转换为这样的?