问题标签 [rapidminer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
excel - Rapidminer / Excel 缺失值替换
我正在学习如何在项目中使用 Rapidminer。我在某个时候卡住了。我有一个数据集如下:有国家。对于每个国家,我都在跟踪 1990-2012 年的一些价值观(比如说奖牌)。举个例子:
国年金银铜
/li>
我想要做的是替换缺失值。例如,西班牙在 1992 年的银牌上有缺失值。我想找到西班牙可用的 Silver 数据的平均值,并用它替换缺失的值。我怎样才能做到这一点?如果 Rapidminer 中的当前模块无法做到这一点,是否有某种宏等?我也可以使用 Excel 来预处理数据(但如何)???。
frequency - RapidMiner - 出现范围
我想按最频繁(最流行的 10 个)过滤我的结果(文档出现)。我怎么做?
rapidminer - 是否可以从命令行将 CSV 导入 RapidMiner 存储库?
我正在考虑使用 RapidMiner 来存储和分析由脚本过程收集的数据集合。有没有办法从命令行脚本将 CSV 文件导入 RapidMiner 存储库?
rapidminer - RapidMiner 不工作
我在 RM 论坛上问过这个问题,但没有人回答。我创建了 SVM 预测模型,它曾经一直工作,直到有一天它突然给出错误“无法提供参数“kernel_type”设置为“多项式”的 AttributeWeights。”任何人都知道我点击了什么错误,因为我无法使用 RM 构建任何模型了。
cluster-analysis - 适用于非常小的集群的聚类算法
我正在尝试在大约 5000 条记录的列表中查找重复项。每条记录都是一个人的姓名和地址,但都在一个字段中输入不一致,所以我正在尝试一种模糊匹配方法。我的方法(使用rapidminer)是对文本进行一些预处理(即标记化,删除常见和不相关的单词,例如“先生”等),生成TF-IDF并使用DBSCAN对匹配记录进行聚类。这很有效,并给出了很好的结果,但是当我尝试运行完整的数据集时需要很长时间。这也会导致很多只有一个元素的簇,我不知道这会如何影响 DBSCAN 的计算时间。
是否有一种聚类算法可以更快地处理此类数据,或者是否有更好的方法来解决这个问题?
java - 将 rapidminer 实现为 java 应用程序
使用 rapidminer 5.2 设计了一个决策树模型 我想使用 java 实现和查看结果 我使用从 rapidminer 生成的 xml 并在 java 中作为 process.run() 运行过程 但我想使用 java 查看我的决策树
machine-learning - 在 Rapid Miner 中为数值属性添加常量值
我正在使用 rapidminer,我有一个带有数字字段(属性)的数据集,我想简单地为这个特性的所有值添加一个常量(例如 1),
我该怎么做?到目前为止,我还没有发现任何简单的东西。
machine-learning - 在 RapidMiner 中优化决策树参数
我正在处理一个相当大的数据集(770K 记录,2K 个属性,几乎所有这些属性都是二项式但都是整数形式),
我想通过 10 倍交叉验证对数据应用决策树,但我有一些问题:
1.为什么决策树(例如深度为10)需要这么多时间来训练?实际上我在训练树之前将数据(因为它不平衡)平衡到原始大小的 40%(~320K 记录),但这仍然需要很多时间,是否有任何其他版本的决策树可以产生相同的性能和需要更少的时间?(以二项式形式制作属性是否会使其更快?)
2.如何优化决策树的参数?我应该在整个 X-validation 上优化它吗?
machine-learning - 在 RapidMiner 中更改特征值类型
我有一个包含许多属性(2k)的数据集,其中一些(大约 10 个)不是二进制的,其余的是二进制的(0,1),我想将这些二进制属性的值类型从 integer 更改为 binomial ,如功能的名称不固定我想根据它们的值来做!(即将值为0,1的所有属性的值类型从整数更改为二项式)
在 Rapid Miner 中是否有任何直接的方法可以做到这一点?
groovy - 将 FPGrowth 与 rapidminer 一起使用时如何获取频繁项集值?
在rapidminer中,FPgrowth 算法的应用并没有给出属性的实例,而是给出了属性的名称及其支持。我的问题是如何通过Groovy
. 谢谢