问题标签 [gbm]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1094 浏览

r - 运行 varImp(gbm_model) 时出错

我正在为分类问题运行 gbm 模型。下面是我的代码和输出

打印输出(gbm1)

当我尝试打印顶级变量时,它会引发错误。

任何建议如何纠正此错误。

0 投票
0 回答
171 浏览

machine-learning - 为 GBM 模型选择采样率

我已经创建了几个 GBM 模型来调整我的数据的参数(树、收缩和深度),并且该模型在超时样本上表现良好。数据是信用卡交易(数以亿计),所以我抽样了 1% 的好(非事件)和 100% 的坏。

然而,当我将样本量增加到好的 3% 时,性能有了显着的提高。我的问题是 - 我如何确定最佳采样率,而无需运行多次迭代并决定哪一个最适合?有没有关于这个的理论?

我有大约 300 万笔总交易(对于 1% 的样本),包含 380k 坏账和约 250 个变量

0 投票
1 回答
63 浏览

r - R中的“gbm”包是否具有决策树以外的基本功能?

如果没有,哪些包实现了用于提升方法的多个基函数。非常感谢。

0 投票
1 回答
4461 浏览

r - Understanding tree structure in R gbm package

I am having some difficulty understanding how the trees are structured in R's gbm gradient boosted machine package. Specifically, looking at the output of the pretty.gbm.tree Which features do the indices in SplitVar point to?

I trained a GBM on a dataset, here is the top ~quarter of one of my trees -- the result of a call to pretty.gbm.tree:

It looks to me here that the indices are 0 based, from looking at how LeftNode, RightNode, and MissingNode point to different rows. When testing this out by using data samples and following it down the tree to their prediction, I get the correct answer when I consider SplitVar to be using 1 based indexing.

However, 1 of the many trees I build has a zero in the SplitVar column! Here is this tree:

What is the correct way to view the indexing used by gbm's trees?

0 投票
1 回答
334 浏览

r - 是否可以在 R 中精简 GBM 模型?

是否可以从 GBM 拟合模型中删除数据?我知道这个keep.data选项。但是,我希望能够在处理过程中保留数据,然后对其进行精简。另外,如果我只想保留一棵树以供未来预测(假设在拟合 1000 棵树之后,我认为 500 棵树在我的情况下效果最好,所以我想只保留这棵树。有没有安全的方法在不影响预测新数据的能力的情况下从拟合模型中删除多余的数据?

0 投票
0 回答
434 浏览

r - FSCRET 不在 r 中工作

我正在尝试在 r 中使用“fscaret”函数进行特征选择,但它抛出了一个我找不到任何信息的错误。错误是

Dput(head(data,2)) 如下所示:

我试过的脚本是:

数据确实包含很多 NA,使用“gbm”的想法是它可以处理缺失值。

“traindf”包含随机选择的数据的 75%。“testdf”包含其余 25%。

任何帮助都感激不尽。

问候,

0 投票
1 回答
15274 浏览

r - Caret train 方法抱怨出问题了;缺少所有 RMSE 度量值

gbm在尝试拟合或rpart模型时,我多次遇到此错误。最后,我能够使用公开可用的数据始终如一地重现它。我注意到使用 CV(或重复 cv)时会发生此错误。当我不使用任何适合控件时,我不会收到此错误。有人能解释一下为什么我总是不断出错。

0 投票
1 回答
396 浏览

r - 试图让 gbm2sas 包工作

我正在试验 R 包 gbm2sas 和 gbm。

我正在尝试创建一个 gbm 模型对象(使用 gbm() 函数)并生成将实现该模型的 SAS 代码(使用 gbm2sas() 函数)。我无法让它工作。我收到以下错误。

这是我的 R 代码:

我得到以下输出和错误:

谁能指出我做错了什么?

谢谢。

0 投票
0 回答
2373 浏览

r - 使用 [R] 包 caret 和 gbm:“向量中的错误(类型,长度):向量:无法创建模式为‘NULL’的向量”

我正在尝试使用 R 中的 Caret 和 gbm 包在数据帧上训练提升模型。我已经能够使用默认参数成功构建模型;但是,当我尝试自定义摘要功能时,我继续遇到此错误:

这是我发布的第一个问题,因为我通常能够找到信息来解决问题。在这种情况下,我似乎找不到类似的问题。

以下代码旨在重现该错误。如果没有,或者我是否应该包含其他信息,请告诉我,因为我很乐意这样做。

System.info:
sysname : Windows
版本: 7 x64
版本: build 7601, Service Pack 1
version.string : R 版本 3.1.3 (2015-03-09)
系统: x86_64, mingw32

0 投票
1 回答
5569 浏览

r - 'caret' 包中的错误“找不到函数”,R

我正在尝试通过 R 中的插入符号包运行“gbm”。接收到“未找到方法“gbm.fit” ”错误。gbm 包已加载,R、RStudio、caret 和 gbm 已更新到最新版本(请参阅下面的版本信息)

这是一个[可重现的]示例

加载所需的包

并行启动(或不启动,结果相同)

为插入符号设置控制参数 - 几乎所有默认值

为参数搜索设置网格 - 没什么特别的

为示例生成虚拟数据。真实数据更复杂,但结果与这个玩具示例相同

尝试运行火车功能

得到错误 = gbm.fit 未找到

例如,我怀疑这可能是并行问题(如此)。但是,禁用并行执行并没有帮助。我有点迷路了。我知道有些人使用插入符号取得了巨大的成功。它可能需要一些基本的东西,我缺少的东西。

R 版本信息