问题标签 [boosting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
124 浏览

python - 使用 Python 进行梯度提升 - 一般问题

我想要达到的目标。

我的数据格式如下。每日天然气价格结算。A 栏:2018 年 12 月至 2026 年 12 月的各行 B 栏:2018 年 12 月至 2026 年 12 月的 Gas 开盘价 C 栏:2018 年 12 月至 2026 年 12 月的之前 Gas 价格。

我想在 Python 中使用梯度提升算法来预测 2026 年 12 月之后的价格,但我认为通常算法的输出会在实现 D 矩阵和后续命令后返回某种数组,然后再运行几个步骤来绘制散点图。

问题。

使用数组(生成的数据),我不知道接下来应该做什么来预测 2026 年 12 月及以后,因为我的散点图可能只需要训练和测试数据集并做出预测,但是我感兴趣的未来几年呢?

0 投票
0 回答
26 浏览

machine-learning - 对树木的预测进行加权平均是否被视为提升?

在构建随机森林时,一种方法是对所有树的预测进行简单平均。或者,我们也可以通过错误率函数计算分配给每棵树的权重。然而,这是一种提升吗?

我最初认为提升必须在训练期间将焦点顺序更新到错误分类的样本,但我不确定这是必须的。谢谢!

增强随机森林(p3): http: //www.vision.cs.chubu.ac.jp/MPRG/C_group/C058_mishina2014.pdf

0 投票
1 回答
277 浏览

r - 如何正确模拟平滑样条的偏差和方差?

我的目标是针对不同的自由度绘制三次平滑样条的偏差方差分解。

首先,我模拟了一个测试集(矩阵)和一个训练集(矩阵)。然后我迭代了 100 多个模拟,并在每次迭代中改变平滑样条的自由度。

我用下面的代码得到的输出没有显示任何权衡。计算偏差/方差时我做错了什么?

作为参考,该图的右侧面板(幻灯片 14)显示了我期望的权衡(来源

0 投票
1 回答
392 浏览

python - LogitBoost 要求基估计量是回归量

我有一个数据集,每个特征的所有值都是数字,甚至是类/标签列。在用 python 实现的提升算法(如 logitboost、adaboost、gradientboosting)中,除了预设的基本估计器(或弱学习器,迭代我们的数据的模型)之外,我们可以指定一个分类算法,如 SVM 中的 SVC,如朴素贝叶斯等上。(一些算法/包,如在 python 中实现的 xgboost 和 catboost,除了包中实现的那些之外,不能接受任何其他基本估计器......也许是实现偏好?)

通过这个介绍,我提出了我的问题。此处的代码不起作用并给出此错误:LogitBoost requires the base estimator to be a regressor.

请不要介意缩进。它在这里显示错误,但是,它在空闲时是正确的。我为此道歉。

该行:

不适用于 SVC,它应该这样做,因为 logitboost 是一种分类算法。但是,它确实适用于 SVR(支持向量回归),这不是我想要的。谁能解释为什么会发生这种情况以及我该如何解决?为了比较公平起见,我需要为每个算法使用相同的基本估计器......

谢谢。

0 投票
0 回答
451 浏览

regression - 回归 XGBoost 模型的残差图问题

我正在使用 xgboost 构建回归树。我正在做一个 GridSearch 来找到最佳参数。我的训练集有大约 800 个实例,我正在做一个 CV = 3。一旦建立模型,我会在残差图中看到一些问题。这就是残差图的方式看起来像。

在此处输入图像描述

所以残差图中存在明显的递减规律。考虑到 xgboost 是非常健壮的模型,这里有什么问题吗?

0 投票
1 回答
662 浏览

lightgbm - LightGBM ranker 函数使用什么评估指标

我正在使用LGMRankerfromLightGBM但不确定我应该使用什么评估指标。这是我的代码:

这里有什么合适的?我没有任何组,我应该指定一些东西吗?

0 投票
0 回答
142 浏览

r - 在 R 中可视化数据生成过程的组件

我尝试使用那里给出的真正底层函数来复制这个数字(另请参见下面的代码)。

我想知道作者是如何想出这个(乍一看很容易复制的)图的。如果我看例如 (11) f(X_1) = 8*sin(X_1) 的第一个分量,我看不出作者如何获得具有负函数值的相应图(据我理解的论文,域X 的取值范围为 0 到 3)。关于最后一个线性分量的相同混淆。

全文链接:https ://epub.ub.uni-muenchen.de/2057/1/tr002.pdf

这是我的代码

0 投票
1 回答
25 浏览

solr - Solr 7 升压

使用 SOLR 7.XI 正在考虑基于 SKU 匹配提升搜索

select?fl=SKU&q=text:234^1 或 SKU:A234-TRIM-WH^10

结果:

我期待 A234-TRIM-WH 成为我的第一个结果。知道我做错了什么吗?

0 投票
1 回答
2156 浏览

python - LightGBM 忽略有关“boost_from_average”的警告

我使用 LightGBM 模型(版本 2.2.1)。它在火车上显示下一个警告:

[LightGBM] [警告] 从 2.1.2 版本开始,“binary”目标中的“boost_from_average”参数默认值为 true。与以前的 LightGBM 版本相比,这可能会导致明显不同的结果。如果您的旧模型产生不良结果,请尝试设置 boost_from_average=false

我发现它是关于什么的:github 链接

但是我没有使用任何旧模型或遗留代码(它是在 LightGBM 2.2.1 版本上创建的新项目),所以我不需要每次都看到这个警告。

我也知道我可以更改verbose并关闭所有警告。但这并不是很好 - 另一个可能有用!

所以我的问题是:是否可以关闭(隐藏)这个警告?

0 投票
1 回答
158 浏览

r - 插入符号:glmboost 中的系列规范不起作用

我正在尝试对 Caret(与 Huber 家族)进行增强的稳健回归,但是在训练模型时出现错误:

我收到错误“找不到函数 Huber()”,但它明确包含在 mboost 包中(glmboost 所基于的包)。

任何帮助将非常感激。