问题标签 [rapidminer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
3094 浏览

java - 用java进行简单的情感分析

我对情绪分析很陌生。我如何判断给定的单词或句子是肯定的还是否定的。我必须用java实现它。我试图阅读类似 lingpipe、rapidminer 的教程,但我不明白。在他们的示例中,他们使用了大量数据。就我而言,我没有太多数据。我只有一个词或一个句子,让我们说。我也尝试从 stackoverflow 阅读问题。但他们对我帮助不大。提前致谢。

0 投票
2 回答
3695 浏览

xpath - rapidminer 可以从 URL 列表中提取 xpath,而不是先保存 HTML 页面吗?

我最近发现了 RapidMiner,我对它的功能感到非常兴奋。但是,我仍然不确定该程序是否可以帮助我满足我的特定需求。我希望程序从我用另一个程序生成的 URL 列表中抓取 xpath 匹配项。(它比 RapidMiner 中的 'crawl web' 运营商有更多选择)

我看过 Neil Mcguigan 的以下教程:http: //vancouverdata.blogspot.com/2011/04/web-scraping-rapidminer-xpath-web.html。但是我尝试抓取的网站有数千页,我不想将它们全部存储在我的电脑上。而且网络爬虫只是缺少关键功能,所以我无法将它用于我的目的。有没有办法让它读取 URL,并从每个 URL 中抓取 xpath?

我还查看了从页面中提取 html 的其他工具,但由于我不是程序员,所以我无法弄清楚它们是如何工作(甚至是安装)的。另一方面,Rapidminer 易于安装,操作员的描述很有意义,但我无法以正确的顺序连接它们。

我需要一些投入来保持动力。我想知道我可以使用什么运算符来代替“从文件中处理文档”。我查看了“从网络处理文档”,但它没有输入,它仍然需要爬网。任何帮助深表感谢。

期待您的回复。

0 投票
0 回答
283 浏览

associations - 如何使用 RapidMiner 检测大型数据集中非常弱的关联?

我有一个庞大的书名及其作者数据集,我想找出哪些作者更有可能相互合作!我试图通过 rapidminer 中的关联规则和 fp-growth 模块来解决这个问题,但它不起作用!我想因为词向量很大,和整个矩阵相比,科学家之间的合作不会是一个很大的数字!

您能否告诉我如何解决这个问题,或者是否有类似的免费软件可以用于此目的。

谢谢,

0 投票
0 回答
159 浏览

rapidminer - 我们可以使用 RapidMiner 文本处理插件来绘制合着网络吗?

我想知道我们是否可以使用 RapidMiner 的文本处理插件来创建我们可以从 Pajek 获得的共同作者网络。如果是,请告诉我如何。

谢谢,

0 投票
2 回答
3753 浏览

data-mining - RapidMiner 错误:常规属性必须是二项式。市场篮子分析

我正在尝试学习使用 RapidMiner,我的老板希望我对一组数据进行购物篮分析。但是当我使用给定的模板时,我收到以下错误:

常规属性必须是二项式。
这是通过 FP-Growth 算子给出的。

我有一个 customerID(只有数字)、一个 productName(字母)和一个 Product Quantity(数字)列。

由于我是 RM 的新手,我不知道出了什么问题。

任何投入将不胜感激。
先感谢您。

0 投票
1 回答
520 浏览

rapidminer - rapidminer 一些概念

在rapidminer中是什么意思:

我正在尝试使用 rapidminer,但我无法理解这个概念。任何帮助都将不胜感激,尽可能新鲜。

0 投票
1 回答
1739 浏览

java - 如何将 RapidMiner 集成到 PHP Web 应用程序中?

我在 RapidMiner 中有一个实现,它根据 Bloom 的分类法对问题进行分类。我需要使用由 PHP 开发的 Web 应用程序生成的数据,并在 Web 应用程序的界面中显示结果。

所以我想知道PHP中的应用程序是否有可能与RapidMiner通信以处理数据并在界面中显示RapidMiner提供的结果。

我知道 RapidMiner 是用 Java 实现的,并且可以选择使用 Java 桥来通信 PHP 和 JAVA,但我不确定这是否是一个解决方案。

0 投票
1 回答
2803 浏览

rapidminer - RapidMiner 5.2 将数值转换为标称和反向

我在 RapidMiner 5.2 中使用 k-means 算法对一堆单词进行聚类,我在聚类之前将名义转换为数值。但是,要真正查看我的聚类,我需要将数字视为单词。我怎样才能把它转换回来?

0 投票
2 回答
2177 浏览

java - 图像处理中的距离测量

我真的希望有人可以帮助我,因为我真的坚持这个。我将有一个需要处理的大型图像数据集,由于集合的大小无法手动处理。

需要做的是我需要在每张图像大约 30 个对象的集合中找到水平像素距离。这些对象都是相同的形状和相似的颜色(即较浅/较深的阴影)。X/Y 0,0 将分配给最低 Y 对象的中心 X 底部 Y 边界,从那里我需要测量并记录到图像中剩余 29 个对象中每个对象中心的 x 轴距离。中心部分并不是真正必要的,因为我可以重新调整以重新对齐中心,其主要目的不一定是 x/y 坐标,而是它们显示/具有的模式。

我已经能够使用 Photoshop 以及带有 IMMI 扩展的 Rapidminer 来提取对象,但是我找不到任何测量距离的工具。我看过 JavaCV,但没有看到任何可以做到这一点的东西。如果有人对工具包、Java 或其他方式有任何想法,请告诉我!

如何测量我已经找到的 2 个对象之间的距离?

0 投票
1 回答
568 浏览

rapidminer - 仅在加载模型一次时对来自 Java 代码的输入进行分类

我正在开发一个使用 RapidMiner 进行分类的应用程序。我不时(例如每天)训练分类器,但我以非常高的速度使用分类器(每秒 250 次)。为此,我使用 RM GUI 创建了两个进程。第一个训练分类器并将其保存到模型文件中,而第二个使用它进行分类。

在第二个过程中,我加载第一个过程创建的模型文件。这使它变得非常慢,因为似乎每次我想对输入进行分类时该过程都会加载它。可以在下图中看到第二个过程:( 来源:shiaupload.ir

这样做更聪明的方法是什么?

PS 我认为一个解决方案是创建另一个进程,它只加载创建的分类器一次,然后将其作为另一个输入提供给 ApplyModel 子进程。但是我没有在 Java 代码中找到这样做的解决方案。