问题标签 [rapidminer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
rapidminer - 在 Rapidminer 中拆分列后如何更改新列列的类型?
RM 非常新,进展缓慢。
我拆分了一列,使得新列是该字段自动设置为的一列数字polynomial
。
我如何将其设置为Numerical
甚至更好Integer
?
我试过Geuss Type
了,但这没有用
谢谢
rapidminer - RapidMiner 中的文本向量到决策树
1 ad-jerry ad-bruckheimer ad-chase ad-premier ad-sept ad-th ad-clip ad-bruckheimer ad-chase 页面
-1 广告症状 ad-muscle ad-weakness ad-genetic ad-disease ad-symptom ad-include ad-search ad-learn page found
1 1:1 2:1 3:1 4:1 5:1 6:1 7:1 8:1 9:1
-1 8:1 9:1 429:1 430:1 431:1 432:1 433:1 434:1 435:1 436:1
我有文本向量及其对应的术语向量,我想在快速矿工中使用 ID3 算法学习决策树,但我不知道如何为 ID3 算法处理此类数据。我尝试在术语向量上运行 ID3(Read CSV->ID3->Model),但我不知道它是否工作正常。请帮忙。
java - 启动一个使用 Rapid miner 的 java 项目
我被要求开发一个将使用 Rapidminer 库的项目,我将从该库中提供一个界面来以某种图形形式查看结果。我不是高级程序员,但可以使用代码。
我已经在我的项目中包含了所有包、库和必要的 jar,我正在使用 eclipse 构建它们。
参考互联网上的一些网站和代码,我已经开始在我的程序中集成 Rapidminer,但没有这样做。
请指导我开始我的项目,或者任何来自互联网的好资源,我可以在那里学习并能够从头开始开发我的项目。
我看过 Rapidminer 的博客和网络,但我无法正确理解。
感谢...感谢您的帮助和宝贵的时间!!
regex - 在处理数据之前如何从示例集中删除文本?
我正在使用 RapidMiner 5.3.013。我正在从 Remedy 读取包含数千行工作日志的 excel 文件。我想根据正则表达式删除文本,^[A-Z][\w\d/?(# ]+[\w0-9#)]{2}:
然后使用 Process Documents from Data。到目前为止还没有想出如何做到这一点。我可能只是编写 VBA,但想知道如何在 Rapidminer 中完成。
javascript - 有没有一种方法可以抓取网站并抓取每个页面上的 JavaScript 变量?
我工作的公司将在几个月后进行网站重新设计,我们需要的其中一件事是包含网站上每个页面的每个 URL 的表格。然后,最理想的情况是,会有包含一组预定义 JavaScript 变量(在本例中为 Omniture 变量,因此我们可以确保每个页面都正确标记其在站点层次结构中的位置)的值的列。
以下是给定页面的 HTML 中可能包含的内容的示例:
我已经用 RapidMiner 爬取了该站点并且数据已准备就绪,但我的问题是隔离这些变量并将“metrics_level2”、“metrics_level3”等放在他们自己的列中的最佳方法。XPath 是最好的方法吗?常用表达?我对 XPath 的尝试似乎在标签之间引入了全部内容,这需要在事后进行大量清理。
python - SVM:通过训练 SVM 组合每个参数的各个分数
大家好,所有机器学习专家,我对机器学习主题很幼稚。我的数据有六个特征(6 个常规属性)和 2 个标签(1 个特殊属性)(真假)(希望我使用了正确的术语)。我想结合那些必须由 SVM 训练的功能。数据看起来像这样:-
所以我想在这里做 total = X1*ZDis+X2*ZAnch+X3*ZSurf+X4*Zval+X5*ZDom+X6*ZEntropy 其中 X1..X6 是应该来自 SVM 的加权值。我使用 rapidminner 为我的 40 个训练集示例获取此权重值,结果如下:-
我不确定我是否采取了正确的方法,所以我需要你的帮助。提前致谢。另外,如果有人指导我如何在 python 中编写有关此 SVM 问题的代码,这对我也有帮助。
谢谢帕拉布
在收到您的反馈后,我再次对我的问题进行了一些分析,其中我有 277 个数据集,8 个是正面的,269 个是负面的,有 8 个特征,所以它清楚地向我展示了它的不平衡数据集。正如我之前所说,我想通过 SVM 权重对我使用 SVM 的所有特征给予同等重视,然后我想这样做( w1*x1+w2*x2+...+w8*x8)
,这将帮助我从数据集中提取真实结果。数据如下:-
我的 svm 输出是
我的问题在这里,我的方法现在足够好了吗?我用来优化 SVM 的所有参数都很好吗?我在这个问题上非常天真!谢谢帕拉布
r - Rapidminer:转换 unix 时间戳
有人知道将 unix 时间戳转换为 date_time 属性的方法吗?
我尝试使用 R 扩展(我的运算符主要是用 R 编写的),例如 .POSIXct 函数来转换时间戳,但似乎 rapidminer 不喜欢它并一直忽略它。
任何帮助表示赞赏
谢谢
rapidminer - 提取 RapidMiner 线性回归模型系数
我想运行一个依赖于线性回归模型系数的模拟。
在 RapidMiner 中,我如何提取线性回归模型系数?
如果我可以将这些系数转换为宏参数,我会发现它非常有用吗?
machine-learning - Rapidminer - 无法应用学习算法,因为流程文档正在对文本进行常规处理
有以下过程:
- 从文件中处理文档 (我在其中加载具有相应 6 个类的文本文件)-> 这连接到设置角色(将文本属性更改为 REGULAR 属性以允许机器学习)->从数据中处理文档(我不需要词向量所以我取消选中,我保留文本,在这个过程中我标记化,停用词,词干等),然后我将它输入验证运算符。(贝叶斯/svm)
这里发生的事情是在示例集中,在从数据运行处理文档后,文本列将返回从常规类型“TEXT”。因此我得到错误Input ExampleSet has no attributes因为有零个常规属性。这导致该过程失败。我不知道为什么。在此之后我尝试再次设置角色,但随后错误显示“示例集中没有示例”
请帮忙。我被困两天了!!!
编辑:我想我知道这个问题 - 我在一个数据集上应用了 10 倍 X-Validation,只有几个例子
nlp - 使用 Rapidminer 计算电子邮件对话的数量
我有一个 Excel 表,其中包含有关问题解决方案的详细信息,其中一列包含针对相应问题的电子邮件对话。本质上,每一行都有一个针对该问题的电子邮件对话(issueid 是该数据的主键)。电子邮件对话格式一致
发件人:“姓名”\n 日期:“时间戳”\n 主题:“主题”\n 收件人:“姓名”\n“正文”
这种模式再次重复......
现在我需要使用 Rapidminer 找出每个问题发生了多少电子邮件对话。我已经阅读了 Excel,Rapidminer 中的每一行都有可用的数据......我该如何做到这一点?
任何帮助将不胜感激......