问题标签 [rapidminer]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

509 问题

0 投票

1 回答

2257 浏览

excel - Rapidminer / Excel 缺失值替换

我正在学习如何在项目中使用 Rapidminer。我在某个时候卡住了。我有一个数据集如下：有国家。对于每个国家，我都在跟踪 1990-2012 年的一些价值观（比如说奖牌）。举个例子：

国年金银铜

/li>

我想要做的是替换缺失值。例如，西班牙在 1992 年的银牌上有缺失值。我想找到西班牙可用的 Silver 数据的平均值，并用它替换缺失的值。我怎样才能做到这一点？如果 Rapidminer 中的当前模块无法做到这一点，是否有某种宏等？我也可以使用 Excel 来预处理数据（但如何）？？？。

2012-11-11T00:09:43.017

0 投票

1 回答

1159 浏览

frequency - RapidMiner - 出现范围

我想按最频繁（最流行的 10 个）过滤我的结果（文档出现）。我怎么做？

在此处输入图像描述

frequency rapidminer

2012-11-11T11:53:31.467

0 投票

1 回答

1909 浏览

rapidminer - 是否可以从命令行将 CSV 导入 RapidMiner 存储库？

我正在考虑使用 RapidMiner 来存储和分析由脚本过程收集的数据集合。有没有办法从命令行脚本将 CSV 文件导入 RapidMiner 存储库？

rapidminer

2012-11-19T23:25:15.847

0 投票

1 回答

300 浏览

rapidminer - RapidMiner 不工作

我在 RM 论坛上问过这个问题，但没有人回答。我创建了 SVM 预测模型，它曾经一直工作，直到有一天它突然给出错误“无法提供参数“kernel_type”设置为“多项式”的 AttributeWeights。”任何人都知道我点击了什么错误，因为我无法使用 RM 构建任何模型了。

rapidminer

Siga

2012-11-20T19:31:44.877

0 投票

2 回答

2064 浏览

cluster-analysis - 适用于非常小的集群的聚类算法

我正在尝试在大约 5000 条记录的列表中查找重复项。每条记录都是一个人的姓名和地址，但都在一个字段中输入不一致，所以我正在尝试一种模糊匹配方法。我的方法（使用rapidminer）是对文本进行一些预处理（即标记化，删除常见和不相关的单词，例如“先生”等），生成TF-IDF并使用DBSCAN对匹配记录进行聚类。这很有效，并给出了很好的结果，但是当我尝试运行完整的数据集时需要很长时间。这也会导致很多只有一个元素的簇，我不知道这会如何影响 DBSCAN 的计算时间。

是否有一种聚类算法可以更快地处理此类数据，或者是否有更好的方法来解决这个问题？

cluster-analysis data-mining text-processing rapidminer dbscan

2012-11-26T14:14:29.083

0 投票

1 回答

2410 浏览