问题标签 [rapidminer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
726 浏览

data-mining - Rapidminer 的运行时提示

我一直在使用 Rapidminer 并创建了一系列流程来执行一组标准任务。现在,我想让用户在开始时动态设置进程的参数。

例如,在编写 CSV 时,我想提示用户键入一个字符串,其中包含应通过某个提示保存它的位置(在脚本开始时,或在过程中的某个其他阶段。

这可以通过 Rapidminer 实现吗,还是我应该创建一些脚本来动态生成和运行他的进程?

0 投票
3 回答
19415 浏览

data-mining - 在 Rapidminer 中,一旦我导入数据集,我如何更改列的类型?

我已经将一个数据集导入 Rapidminer 5,并且应该是名义或多项式的列之一被设置为数字。我的数据集有超过 500 个属性,所以我真的不想每次意识到自己犯了这样的错误时都必须重新导入数据。是否有某种方法可以自动化导入过程以便保存我每次设置的列类型,或者我可以返回并编辑我已经导入的数据集属性类型?

0 投票
3 回答
2603 浏览

csv - Rapid miner:带有逗号而不是点的实数的 CSV

我在使用 RapidMiner 导入 CSV 文件时遇到问题。浮点值用逗号代替整数和十进制值之间的分隔点写入。

任何人都知道如何正确导入以这种方式格式化的值?

样本数据:

BMI;1;0;1;1;1;blue;-0,138812155;0,520378909;5;0;50;107;0;9;0;other;good;2011 BMI;1;0;1;1;1;pink;-0,624654696;;8;0;73;120;1;3;0,882638889;other;good;2011

Rapid miner 实际上将其解释为“多项式”。将其强制为“真实”只会导致对“0”值的正确解释。

谢谢

0 投票
2 回答
3533 浏览

cluster-analysis - Rapidminer 中的召回率和精度

excel中有一个数据集,其中包含A列中的一些标签(我称之为集群标签)和B列中的一些属性(我称之为集群组件)。这些数据显示了最好的聚类结果。

但我不知道如何在 rapidminer 中使用这些数据计算其他聚类方法的召回率和精度!

有谁能够帮我?

0 投票
3 回答
1456 浏览

java - 快速矿工 101

我带着一个问题回来了。我正在使用 Rapid Miner 进行自动文本分类,但无法正常工作。我收到一条错误消息,上面写着“示例中没有设置示例,冒犯了操作员的性能”。知道那是指什么吗?

0 投票
1 回答
946 浏览

string - RapidMiner 情绪分析

我有一组被分类为正面或负面的短消息,它们保存在 WEKA 生成的 ARFF 文件中。我想将此数据移动到 RapidMiner 以进行分类和处理。

作为 RapidMiner 的一个完整的新手,任何人都有关于如何为这些消息构建分类器的示例。消息在一个文件中,格式如下:

谢谢!

0 投票
1 回答
2512 浏览

statistics - 重要变量(数值)的数据挖掘:从哪里开始?

我有一个我正在尝试改进的外汇市场交易策略。

我有一个巨大的表格(100k+ 行),代表市场上所有可能的交易、交易类型(买入或卖出)、交易结束后的利润/损失,以及 10 个左右的附加变量,代表各种市场测量开市时间。

我试图找出这 10 个变量中的任何一个是否与利润/损失显着相关。

例如,假设变量 X 的范围是 50 到 -50。买单的 X 平均值为 25,卖单的 X 平均值为 -25。

如果最有利可图的买单价值 X > 25,最有利可图的卖单价值 X < -25,那么我认为 X 与利润的关系很重要。

我想要一个好的起点。我已经安装RapidMiner 5了,以防有人可以给我一个具体的建议。

0 投票
1 回答
1162 浏览

jakarta-ee - 适用于 Dashboard 的平台:Pentaho、Liferay、RapidMiner 或 J2EE(JSF、EJB)

我正在评估仅使用 Java 技术构建仪表板的平台,我想知道最适合这个的平台。

我正在寻找以下类别的解决方案:

  • 易于开发、编程、扩展和与数据库 MySQL 和 DB2 集成。
  • 良好的布局功能、自定义、图表图形和主题支持
  • 专用于仪表板应用程序的完整文档和教程。
  • 一种解决方案,采用 DRY 方式应用开箱即用的观察者模式(或类似方法),以便在源中的数据发生更改时立即在视图中的源(数据库表)和目标(图形或表)之间进行实时同步和可视化信息.

我原则上不想开发所有功能并处理与仪表板界面相关的所有问题,但是如果我没有看到好的资源或完整的教程,我正在考虑自己实现一个 J2EE 应用程序。

0 投票
1 回答
384 浏览

data-mining - 易于与 Free Pascal 集成的数据挖掘库?

我一直在尝试不同的方法来进行模式匹配、分析和预测时间序列数据。

由于我没有数据挖掘或相关领域的专业经验,我从头开始想出了自己的方法。

在零星浏览了几个月的数据挖掘文章(我理解的少数文章)之后,我意识到我的方法非常基础。

例如,我实现模式匹配的方式是通过多维 k-Nearest Neighbor 方法。

我现在才刚刚开始了解应该使用一些常用技术,例如决策树、主成分分析、协方差矩阵等。

我一直在试验 RapidMiner,这是一个 GUI 数据挖掘工具。RapidMiner 允许您拖放各种复杂技术的实现并将它们连接在一起,而无需编写一行代码。这对我来说是一个很棒的学习工具。它看起来像这样:

快速矿工

RapidMiner 有一个 API,但不幸的是它是用 Java 编写的,而我目前所有的代码都是用 Free Pascal 和 MySQL 编写的。

我正在寻找某种方法将 RapidMiner 集成到我的应用程序中,这样我就可以通过 RapidMiner GUI 尝试不同的数据处理方法,并将它们与我当前的代码无缝地结合使用。

如果这不可行,我会选择另一个数据挖掘包,只要它很容易集成到我当前的 Free Pascal 代码中。

我研究了 R - 这似乎是正确的,但与 Free Pascal 集成似乎也不容易。

为清楚起见,我的数据集相当大(超过 500,000 行),计算必须实时进行。该软件在 Windows 7 上运行。

0 投票
1 回答
836 浏览

csv - 将 LISP 数据导入 RapidMiner (CSV,...)

我有 LISP 形式的数据,我需要在 RapidMiner 中处理它们。我是 LISP 和 RapidMiner 的新手。RapidMiner 不接受 LISP(我猜是因为它是编程语言)所以我可能需要以某种方式将 LISP 形式转换为 CSV 或类似的东西。代码的小例子:

如果您有任何建议,我将不胜感激。