问题标签 [ensemble-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 集成模型的错误和 R 中的调整
我一直在尝试在 R 中使用 Ensemble 方法,并在BostonHousing2数据集上尝试插入符号模型的集合。在设置贪心合奏和线性合奏时,我得到一个错误。代码如下:
有几个我被卡住的情况:在设置 model1 时,我收到以下错误消息:
此外,在设置贪婪集成和线性集成时,组合模型时出现列表错误。请请求一些帮助。
PS:道歉,如果这些需要是单独的问题。
python - sklearn Boosting:交叉验证以找到最佳数量的估计器,而无需每次都重新启动
在 Python sklearn 集成库中,我想使用一些增强方法(比如 Adaboost)来训练我的数据。因为我想知道估计器的最佳数量,所以我计划每次用不同数量的估计器做一个 cv。但是,以下方式似乎是多余的:
因为在 AdaBoost 中,一旦我在 # of estimator=50 上训练分类器,当我继续训练 # of estimator=100 时,前 50 个分类器及其权重不会改变。我想知道在这种情况下是否有办法直接用第 51 个弱学习器开始训练。
feature-selection - scikit adaboost feature_importance_
在 python 中实现的 adaboost 算法究竟是如何为每个特征分配特征重要性的?我将它用于特征选择,我的模型在基于 feature_importance_ 的值应用特征选择时表现更好。
python - 如何在 scikit-learn 中使用具有不同基础估计器的 adaboost?
我想将 adaboost 与几个基本估计器一起用于 scikit-learning 中的回归,但我没有找到任何可以做到这一点的类。除了更改源代码之外,有什么办法可以做到这一点?
machine-learning - 您将如何解释集成树模型?
在机器学习中,随机森林等集成树模型很常见。该模型由一组所谓的决策树模型组成。然而,我们如何分析这些模型具体学到了什么?
classification - 不同特征的集成分类器
我正在执行多类分类,并正在研究不同类型的特征对性能的影响。我分别对每组特征使用 SVM 1v1 分类器,现在我想尝试训练一个组合模型,该模型将利用我拥有的所有特征集。有哪些方法可以创建这样一个组合模型,而不是将所有功能简单地倾倒在一起?我的理解是,这类似于集成模型的想法,但是,我找不到可以在多个特征集上运行的集成示例。
我还应该提到,我正在寻找开箱即用的实现或一些库,而不是自己实现模型。
r - 结合二元分类算法
我有几种算法通过为每个观察分配目标值等于 1 的概率来解决二进制分类(响应为 0 或 1)问题。所有算法都试图最小化对数损失函数,其中 N 是观察数,y_i是实际的目标值,p_i是算法预测的1的概率。这是一些带有示例数据的 R 代码:
示例代码给出了每种算法的对数损失:
现在我想结合这些算法,这样我就可以进一步减少对数损失。是否有任何 R 包可以为我做到这一点?我将感谢任何解决此类问题的算法、文章、书籍或研究论文的参考。请注意,作为最终结果,我希望获得每个类的预测概率并注意简单的 0,1 响应。
r - H20 中的堆叠回归中的错误消息 - R
我从 H2O 开始,并尝试在 R f 中集成随机森林和多元线性回归。我使用的 H2O 数据框如下:
然后,我尝试设置两个模型和超级学习器来预测变量“dif”,代码如下:
但是,我收到此错误消息:
我的代码有什么问题?
machine-learning - 集成学习的一些具体例子是什么?
有哪些具体的现实生活示例可以使用 Boosting/Bagging 算法解决?代码片段将不胜感激。
r - 使用 SVM 在 R 中集成
我正在尝试使用 R 中的 SVM 对一些数据进行分类。
数据集:
D1、D2、D3 取值从 0 到 9,每个字取 0/1 值。
首先,我想构建一个基于 word1、word2 等预测 D1 的分类器。然后我想构建一个基于它在 D1 中预测的内容和单词来预测 D2 的分类器。D1、D2 和 D3 曾经是一个 3 位数字,并且一个数字与前一个数字之间存在关系。
到目前为止,我有:
但我完全迷路了,欢迎任何帮助。
谢谢