问题标签 [ensemble-learning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql-server - SSAS 中的集成分类器(随机森林、Bagging、Boosting 等)
我正在使用 SSAS (SQL Server 2008 R2) 为缺少 80% 值的数据集开发分类模型。基于树的集成分类器被认为是最好的解决方案(例如随机森林)。
有没有什么好方法可以将集成分类器添加到 SSAS 中?例如AdaBoost或任何其他 Bagging 或 Boosting 分类器?
我知道 SSAS 提供插件功能,但我没有遇到任何人在做任何集成解决方案......更不用说你可以下载并开始使用的任何东西。
如果没有,是否有任何有效的方法来连接 SSAS 中的各种分类器?我希望我错过了一些明显的东西。
weka - weka 的 JRip 合奏包
如何在 Weka 中安装 jRip 包以进行集成学习。作为通过 ensemble 聚合集体聚类结果的一部分,我需要安装 jRip 包。我在 Web 上找不到任何相关链接,可以访问相同的内容。请帮忙。
c# - 集成学习、多分类器系统
我正在尝试使用 MCS(多分类器系统)对有限的数据做一些更好的工作,即变得更准确。
我目前正在使用 K-means 聚类,但可以选择使用 FCM(模糊 c-means),将数据聚类成组(集群),数据可以代表任何东西,例如颜色。我首先在预处理和规范化之后对数据进行聚类,然后得到一些不同的聚类,中间有很多。然后我继续使用集群作为贝叶斯分类器的数据,每个集群代表一种不同的颜色,贝叶斯分类器被训练,然后来自集群的数据被放入单独的贝叶斯分类器。每个贝叶斯分类器只训练一种颜色。如果我们将色谱 3 - 10 视为蓝色,将 13 - 20 视为红色,而介于 0 - 3 之间的光谱为白色至 1.5,然后逐渐变为蓝色至 1.5 - 3,蓝色变为红色也是如此。
我想知道的是如何或什么样的聚合方法(如果你会使用的话)可以应用,以便贝叶斯分类器变得更强大,它是如何工作的?聚合方法是否已经知道答案,或者是人为交互来纠正输出,然后这些答案会返回到贝叶斯训练数据中?还是两者兼而有之?查看 Bootstrap 聚合它涉及让整体投票中的每个模型具有相同的权重,所以不太确定在这个特定情况下我会使用 bagging 作为我的聚合方法吗?然而,Boosting 涉及通过训练每个新模型实例来逐步构建一个集成,以强调先前模型错误分类的训练实例,不确定这是否是 bagging 的更好替代方案,因为我不确定它是如何在新实例上逐步构建的?最后一个是贝叶斯模型平均,这是一种集成技术,旨在通过从假设空间中采样假设并使用贝叶斯定律将它们组合来近似贝叶斯最优分类器,但是完全不确定如何从搜索空间中采样假设?
我知道通常你会使用竞争方法在两种分类算法之间反弹,一个说是的,一个说可能可以应用加权,如果它正确,你会得到两个分类器的最佳结果,但为了保持起见,我不想要竞争方法。
另一个问题是以这种方式一起使用这两种方法是否有益,我知道我提供的示例非常原始,可能不适用于该示例,但它对更复杂的数据是否有益。
machine-learning - 如何在 RandomForestRegressor (scikit-learn) 中获取所有集成估计
我正在尝试拟合随机森林回归,我想通过查看集合中每个回归树的输出来获得我的估计分布,并以某种列表形式返回给我。在 R 中,predict.all
在预测方法中提供选项randomForest
对我来说是这样做的,有没有办法RandomForestRegressor
在 sklearn 的类中做到这一点?
在 0.13 及更高版本中,我看到了 apply 返回叶索引的方法,但是我不确定如何使用这些,并且我在RandomForestRegressor
.
谢谢你的帮助。
python - GradientBoostingClassifier 与 scikit-learn 中的 BaseEstimator?
我尝试在 scikit-learn 中使用 GradientBoostingClassifier,它的默认参数可以正常工作。但是,当我尝试用不同的分类器替换 BaseEstimator 时,它不起作用并给了我以下错误,
你有什么解决问题的办法。
可以使用以下代码段重新生成此错误:
这是错误的完整追溯:
machine-learning - 什么是弱学习者?
我想将不同分类器的不同错误率与弱学习器的错误率(比随机猜测好)进行比较。所以,我的问题是,对于一个简单、易于处理的弱学习器有哪些选择?或者,我是否错误地理解了这个概念,弱学习者只是我选择的任何基准(例如,线性回归)?
scikit-learn - 如何使用新的学习算法扩展 scikit-learn 中的集成方法
我有一个需要实现的新决策树集成回归方法算法,如果可以的话,我想在基于 Python 的 scikit-learn 包提供的基础设施上进行构建。我想创建一种新型的基本决策树和一种将它们组合起来进行集成回归预测的新方法。
scikit-learn 的文档侧重于使用,而不是扩展。我已经查看了现有集成方法的代码,但是使用了一些相当微妙的 Python-fu,这使得很难知道从哪里开始。有谁知道解释如何使用自定义类扩展 scikit 的文档?或者有没有这种简单扩展的例子?(它可以在任何模块上;它不必是合奏。)
谢谢。
algorithm - 理解集成学习及其在 Matlab 中的实现
集成学习是特定分类器的许多实例的示例,例如决策树分类器;还是混合了几个分类器,如神经网络、决策树、SVM 等?
我已经查看了这个维基百科对Bagging
一个集成学习器的描述。它说:
Bagging 导致“不稳定程序的改进”(Breiman,1996),其中包括例如神经网络、分类和回归树,以及线性回归中的子集选择(Breiman,1994)。
我对这个描述有点困惑。我还研究了 MATLAB 的集成算法实现。比如这个:
meas
并且species
是fitensemble
函数的输入。在此示例中,它使用AdaBoostM2
类型的弱学习器Tree
并正在使用100
它们。如何处理这个函数的这个简单实例,以表明集成学习用于将不同的分类器组合Neural Net, KNN, Naive Bayes
在一起?
任何人都可以解释什么是集成学习以及 MATLAB 在其fitensemble
功能实现中试图做什么?
opencv - 背景减法:创建高斯混合的整体结构
我想通过修改标准 MOG 算法并创建一个高斯集合结构来改进视频中的背景减法,该结构以帧的各种特征(如归一化色度值、空间梯度和纹理)为模型。我希望通过包含空间特征来减少照明效果。什么是最好使用openCV实现相同的好方法?集成结构要么基于 AdaBoost,要么基于所有高斯模型的简单加权组合。
intersystems-cache - Ensemble/CachObjectscript 中的文件监听器
我是新来的乐团。我想知道,Cache/Ensemble 中是否有类似 filesystemwatcher 的东西。(注意:filesystemwatcher 在 .Net 中)
我的要求如下,我的 Ensemble 制作(业务流程)会将文件放入文件夹中,在该文件夹中,Windows 服务将处理该文件并将该文件替换为新文件。
我的业务流程应该等到新文件在文件夹中可用并开始恢复流程。
请让我知道这在 Ensemble 中是否可行。