问题标签 [gbm]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
6144 浏览

r - GBM 模型生成 NA 结果

我正在尝试运行一个简单的 GBM 分类模型来对随机森林和 SVM 的性能进行基准测试,但我无法让模型正确评分。它没有抛出错误,但预测都是 NaN。我正在使用来自 的乳腺癌数据mlbench。这是代码:

任何人都可以帮助我做错什么吗?另外,我是否必须转换预测函数的输出?我读过这似乎是 GBM 预测的问题。谢谢。

0 投票
0 回答
1209 浏览

r - R中的gbm置信区间?

有人知道如何从 gbm.predict() 函数计算置信区间吗?我想要一种方法来确定我的 gbm 预测的 95% 置信区间。

0 投票
2 回答
3619 浏览

r - gbm 包中的 ROC 分数

我在使用 gbm 包计算 ROC 分数 (AUC) 时遇到问题。我正在使用增强的回归树。我正在运行的脚本是:

它应该产生“训练数据 ROC 分数”和“交叉验证 ROC 分数”以及其他相关参数。我没有得到 ROC 分数。我打电话names(testing.tc5.lr005)。如果我调用它会列出cv.roc.matrix但会产生以下内容testing.tc5.lr005$cv.roc.matrix

[1] 0 0 0 0 0 0 0 0 0 0

roc(TestData$TN,predTN)我尝试通过(TestData~用于预测的数据,即观察值;predTN~预测值)来计算 ROC AUC 。结果是[1]NA. 我不知道我做错了什么,尽管模型的其余部分似乎在合理的测试和 CV 相关性和 SE 值方面做得很好。任何关于我错在哪里或替代的指示将不胜感激!谢谢

0 投票
2 回答
1442 浏览

r - 来自 predict.gbm 的 multiclass.roc

我很难理解如何使用 multiclass.roc 函数('pROC' 包)格式化和利用 predict.gbm('gbm' 包)的输出。

我使用多项式 gbm 来预测验证数据集,其输出似乎是每个数据点属于每个因子级别的概率。(如果我错了请纠正我)

因子水平是1-5,不知道为什么小数加法

我正在尝试使用 multiclass.roc 计算 Hand and Till (2001) 定义的多类 AUC,但我不确定如何在它需要的单个向量中提供预测值。

如有必要,我可以尝试编写一个示例,尽管我认为这对某些人来说是例行公事,而作为新手,我在该过程中遗漏了一些东西。

0 投票
1 回答
2521 浏览

python - Grandient Boosting Regressor:“TypeError:无法使用灵活类型执行减少”

我是 python 新手,我正在尝试使用 Gradient Boosting Regressor 开发一个程序。我有两大组数据,一个训练集和一个测试集,其中我有完全相同的列。我的目标是用训练集的信息来预测测试集的 SeriousDlqin2yrs 列。

这是我写的程序:

但是当我运行程序时,python 给了我这个答案:

我不知道它来自哪里,我阅读了很多关于这个问题的论文,但从未找到解决这个特定问题的方法。

预先感谢您的帮助。

0 投票
1 回答
1362 浏览

r - 使用插入符号优化二元分类的偏差

(示例从Windows 7、R 3.0.2、插入符号 6.0-21 上插入符号中的 train() 的致命错误中借用)

我有这个例子:

但是假设我想优化偏差(这是我认为 gbm 默认返回的)而不是准确性。我知道 trainControl 提供了一个 summaryFunction 参数。如何编写一个针对偏差进行优化的 summaryFunction?

0 投票
1 回答
756 浏览

r - gbm 和 blackboost 的内存使用差异

我正在研究一个具有大约 250000 个观察值和 50 个预测变量的数据库(有些是最终大约 100 个特征的因素),并且我在使用 blackboost() 函数(来自 mboost 包)时遇到了问题,这给了我一个内存分配错误。

同时,gbm() 处理数据量也没有问题。根据文档,blackboost 使用的算法与 gbm 相同。(“ http://cran.r-project.org/web/packages/mboost/mboost.pdf ”)。

目前尚不清楚为什么一个功能能够管理数据库而不是另一个,我的猜测:

  • gbm 有一个子采样策略(由“bag.fraction”参数设置),它似乎没有在 blackboost 中实现并影响内存使用。
  • gbm 使用 CART 函数来构建树,而 blackboost 使用 ctree,这似乎具有巨大的内存占用(如何从 party:::ctree 模型中删除训练数据?

我想使用 mboost 中可用的 AUC() 损失函数,但 gbm 中没有,所以我会对克服 blackboost 内存使用限制的任何建议感兴趣。

另一个额外的问题是,当我尝试减少模型中的变量数量时,我从 blackboost 收到了这个新错误:

它似乎来自 AUC 梯度函数。

谢谢您的帮助。

0 投票
1 回答
1720 浏览

r - 插入符号 ref + gbm + ROC

我正在尝试使用 caret 包中的 rfe 函数,但我无法使其适用于使用 ROC 指标的 gbm 模型。

我在那里发现了一些见解:

插入符号 rfe + 和 ROC 中的特征选择

http://www.cybaea.net/Blogs/Feature-selection-Using-the-caret-package.html

我以这段代码结束:

但我得到这个错误:

编辑

使用此代码:

我必须使用 train 函数,因为当我使用 gbmFuncs 时,我显然遇到了一些问题,因为 gbm.fit 需要一个数字目标变量,但 ROC 度量评估需要一个因素。

谢谢你的帮助。

0 投票
0 回答
956 浏览

r - R~有没有办法从gbm中提取类预测?

考虑代码:

结果:

在此处输入图像描述

有没有办法直接得到预测的类,例如 c(absent,absent,...)

我可以使用以下代码执行此操作:

结果:

[1] “缺席” “缺席” “缺席” “缺席” ...

但是,这总是返回字符串。我希望返回的类型与预测器类型相同(例如,如果预测器是因子类型,我希望结果是因子,或者如果它是整数,结果应该是整数,等等...) . 是否有任何返回预测类的默认函数?

所需行为的示例:

0 投票
2 回答
4685 浏览

r - 在 R 中使用 gbm 进行梯度提升,分布 =“bernoulli”

我正在使用gbmR并应用“bernoulli”选项进行分发以构建分类器,我得到“nan”的异常结果,我无法预测任何分类结果。但是当我使用“adaboost”时,我没有遇到同样的错误。下面是示例代码,我用 iris 数据集复制了相同的错误。

请让我知道是否有解决办法来解决这个问题。我使用它的原因是尝试加法逻辑回归,请建议 R 中是否有其他替代方法可以解决这个问题。

谢谢。