问题标签 [boosting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用 Python 进行梯度提升 - 一般问题
我想要达到的目标。
我的数据格式如下。每日天然气价格结算。A 栏:2018 年 12 月至 2026 年 12 月的各行 B 栏:2018 年 12 月至 2026 年 12 月的 Gas 开盘价 C 栏:2018 年 12 月至 2026 年 12 月的之前 Gas 价格。
我想在 Python 中使用梯度提升算法来预测 2026 年 12 月之后的价格,但我认为通常算法的输出会在实现 D 矩阵和后续命令后返回某种数组,然后再运行几个步骤来绘制散点图。
问题。
使用数组(生成的数据),我不知道接下来应该做什么来预测 2026 年 12 月及以后,因为我的散点图可能只需要训练和测试数据集并做出预测,但是我感兴趣的未来几年呢?
machine-learning - 对树木的预测进行加权平均是否被视为提升?
在构建随机森林时,一种方法是对所有树的预测进行简单平均。或者,我们也可以通过错误率函数计算分配给每棵树的权重。然而,这是一种提升吗?
我最初认为提升必须在训练期间将焦点顺序更新到错误分类的样本,但我不确定这是必须的。谢谢!
增强随机森林(p3): http: //www.vision.cs.chubu.ac.jp/MPRG/C_group/C058_mishina2014.pdf
r - 如何正确模拟平滑样条的偏差和方差?
我的目标是针对不同的自由度绘制三次平滑样条的偏差方差分解。
首先,我模拟了一个测试集(矩阵)和一个训练集(矩阵)。然后我迭代了 100 多个模拟,并在每次迭代中改变平滑样条的自由度。
我用下面的代码得到的输出没有显示任何权衡。计算偏差/方差时我做错了什么?
作为参考,该图的右侧面板(幻灯片 14)显示了我期望的权衡(来源)
python - LogitBoost 要求基估计量是回归量
我有一个数据集,每个特征的所有值都是数字,甚至是类/标签列。在用 python 实现的提升算法(如 logitboost、adaboost、gradientboosting)中,除了预设的基本估计器(或弱学习器,迭代我们的数据的模型)之外,我们可以指定一个分类算法,如 SVM 中的 SVC,如朴素贝叶斯等上。(一些算法/包,如在 python 中实现的 xgboost 和 catboost,除了包中实现的那些之外,不能接受任何其他基本估计器......也许是实现偏好?)
通过这个介绍,我提出了我的问题。此处的代码不起作用并给出此错误:LogitBoost requires the base estimator to be a regressor.
请不要介意缩进。它在这里显示错误,但是,它在空闲时是正确的。我为此道歉。
该行:
不适用于 SVC,它应该这样做,因为 logitboost 是一种分类算法。但是,它确实适用于 SVR(支持向量回归),这不是我想要的。谁能解释为什么会发生这种情况以及我该如何解决?为了比较公平起见,我需要为每个算法使用相同的基本估计器......
谢谢。
lightgbm - LightGBM ranker 函数使用什么评估指标
我正在使用LGMRanker
fromLightGBM
但不确定我应该使用什么评估指标。这是我的代码:
这里有什么合适的?我没有任何组,我应该指定一些东西吗?
r - 在 R 中可视化数据生成过程的组件
我尝试使用那里给出的真正底层函数来复制这个数字(另请参见下面的代码)。
我想知道作者是如何想出这个(乍一看很容易复制的)图的。如果我看例如 (11) f(X_1) = 8*sin(X_1) 的第一个分量,我看不出作者如何获得具有负函数值的相应图(据我理解的论文,域X 的取值范围为 0 到 3)。关于最后一个线性分量的相同混淆。
全文链接:https ://epub.ub.uni-muenchen.de/2057/1/tr002.pdf
这是我的代码
solr - Solr 7 升压
使用 SOLR 7.XI 正在考虑基于 SKU 匹配提升搜索
select?fl=SKU&q=text:234^1 或 SKU:A234-TRIM-WH^10
结果:
我期待 A234-TRIM-WH 成为我的第一个结果。知道我做错了什么吗?
python - LightGBM 忽略有关“boost_from_average”的警告
我使用 LightGBM 模型(版本 2.2.1)。它在火车上显示下一个警告:
[LightGBM] [警告] 从 2.1.2 版本开始,“binary”目标中的“boost_from_average”参数默认值为 true。与以前的 LightGBM 版本相比,这可能会导致明显不同的结果。如果您的旧模型产生不良结果,请尝试设置 boost_from_average=false
我发现它是关于什么的:github 链接。
但是我没有使用任何旧模型或遗留代码(它是在 LightGBM 2.2.1 版本上创建的新项目),所以我不需要每次都看到这个警告。
我也知道我可以更改verbose
并关闭所有警告。但这并不是很好 - 另一个可能有用!
所以我的问题是:是否可以关闭(隐藏)这个警告?
r - 插入符号:glmboost 中的系列规范不起作用
我正在尝试对 Caret(与 Huber 家族)进行增强的稳健回归,但是在训练模型时出现错误:
我收到错误“找不到函数 Huber()”,但它明确包含在 mboost 包中(glmboost 所基于的包)。
任何帮助将非常感激。