“rapidminer”的相关标签问题

0 投票

1 回答

244 浏览

rapidminer - 在 Rapidminer 中拆分列后如何更改新列列的类型？

RM 非常新，进展缓慢。

我拆分了一列，使得新列是该字段自动设置为的一列数字polynomial。

我如何将其设置为Numerical甚至更好Integer？

我试过Geuss Type了，但这没有用

谢谢

rapidminer

2013-09-13T20:22:52.457

0 投票

2 回答

272 浏览

rapidminer - RapidMiner 中的文本向量到决策树

1 ad-jerry ad-bruckheimer ad-chase ad-premier ad-sept ad-th ad-clip ad-bruckheimer ad-chase 页面

-1 广告症状 ad-muscle ad-weakness ad-genetic ad-disease ad-symptom ad-include ad-search ad-learn page found

1 1:1 2:1 3:1 4:1 5:1 6:1 7:1 8:1 9:1

-1 8:1 9:1 429:1 430:1 431:1 432:1 433:1 434:1 435:1 436:1

我有文本向量及其对应的术语向量，我想在快速矿工中使用 ID3 算法学习决策树，但我不知道如何为 ID3 算法处理此类数据。我尝试在术语向量上运行 ID3(Read CSV->ID3->Model)，但我不知道它是否工作正常。请帮忙。

rapidminer

2013-09-20T11:00:07.623

0 投票

1 回答

497 浏览

java - 启动一个使用 Rapid miner 的 java 项目

我被要求开发一个将使用 Rapidminer 库的项目，我将从该库中提供一个界面来以某种图形形式查看结果。我不是高级程序员，但可以使用代码。

我已经在我的项目中包含了所有包、库和必要的 jar，我正在使用 eclipse 构建它们。

参考互联网上的一些网站和代码，我已经开始在我的程序中集成 Rapidminer，但没有这样做。

请指导我开始我的项目，或者任何来自互联网的好资源，我可以在那里学习并能够从头开始开发我的项目。

我看过 Rapidminer 的博客和网络，但我无法正确理解。

感谢...感谢您的帮助和宝贵的时间！！

2013-09-23T11:15:31.490

0 投票

1 回答

703 浏览

regex - 在处理数据之前如何从示例集中删除文本？

我正在使用 RapidMiner 5.3.013。我正在从 Remedy 读取包含数千行工作日志的 excel 文件。我想根据正则表达式删除文本，^[A-Z][\w\d/?(# ]+[\w0-9#)]{2}:然后使用 Process Documents from Data。到目前为止还没有想出如何做到这一点。我可能只是编写 VBA，但想知道如何在 Rapidminer 中完成。

regex text rapidminer

2013-09-24T19:42:41.273

0 投票

1 回答

691 浏览

javascript - 有没有一种方法可以抓取网站并抓取每个页面上的 JavaScript 变量？

我工作的公司将在几个月后进行网站重新设计，我们需要的其中一件事是包含网站上每个页面的每个 URL 的表格。然后，最理想的情况是，会有包含一组预定义 JavaScript 变量（在本例中为 Omniture 变量，因此我们可以确保每个页面都正确标记其在站点层次结构中的位置）的值的列。

以下是给定页面的 HTML 中可能包含的内容的示例：

我已经用 RapidMiner 爬取了该站点并且数据已准备就绪，但我的问题是隔离这些变量并将“metrics_level2”、“metrics_level3”等放在他们自己的列中的最佳方法。XPath 是最好的方法吗？常用表达？我对 XPath 的尝试似乎在标签之间引入了全部内容，这需要在事后进行大量清理。

javascript xpath phantomjs rapidminer adobe-analytics

2013-09-26T19:51:18.433

0 投票

2 回答

358 浏览

python - SVM：通过训练 SVM 组合每个参数的各个分数

大家好，所有机器学习专家，我对机器学习主题很幼稚。我的数据有六个特征（6 个常规属性）和 2 个标签（1 个特殊属性）（真假）（希望我使用了正确的术语）。我想结合那些必须由 SVM 训练的功能。数据看起来像这样：-

所以我想在这里做 total = X1*ZDis+X2*ZAnch+X3*ZSurf+X4*Zval+X5*ZDom+X6*ZEntropy 其中 X1..X6 是应该来自 SVM 的加权值。我使用 rapidminner 为我的 40 个训练集示例获取此权重值，结果如下：-

我不确定我是否采取了正确的方法，所以我需要你的帮助。提前致谢。另外，如果有人指导我如何在 python 中编写有关此 SVM 问题的代码，这对我也有帮助。

谢谢帕拉布

在收到您的反馈后，我再次对我的问题进行了一些分析，其中我有 277 个数据集，8 个是正面的，269 个是负面的，有 8 个特征，所以它清楚地向我展示了它的不平衡数据集。正如我之前所说，我想通过 SVM 权重对我使用 SVM 的所有特征给予同等重视，然后我想这样做( w1*x1+w2*x2+...+w8*x8)，这将帮助我从数据集中提取真实结果。数据如下：-

我的 svm 输出是

我的问题在这里，我的方法现在足够好了吗？我用来优化 SVM 的所有参数都很好吗？我在这个问题上非常天真！谢谢帕拉布

python svm libsvm rapidminer svmlight

2013-10-01T13:29:02.330

0 投票

1 回答

855 浏览

r - Rapidminer：转换 unix 时间戳

有人知道将 unix 时间戳转换为 date_time 属性的方法吗？

我尝试使用 R 扩展（我的运算符主要是用 R 编写的），例如 .POSIXct 函数来转换时间戳，但似乎 rapidminer 不喜欢它并一直忽略它。

任何帮助表示赞赏

谢谢

r rapidminer

2013-10-06T11:50:56.177

0 投票

2 回答

617 浏览

rapidminer - 提取 RapidMiner 线性回归模型系数

我想运行一个依赖于线性回归模型系数的模拟。

在 RapidMiner 中，我如何提取线性回归模型系数？

如果我可以将这些系数转换为宏参数，我会发现它非常有用吗？

rapidminer

2013-10-07T19:04:07.507

0 投票

1 回答

310 浏览

machine-learning - Rapidminer - 无法应用学习算法，因为流程文档正在对文本进行常规处理

有以下过程：

从文件中处理文档 （我在其中加载具有相应 6 个类的文本文件）-> 这连接到设置角色（将文本属性更改为 REGULAR 属性以允许机器学习）->从数据中处理文档（我不需要词向量所以我取消选中，我保留文本，在这个过程中我标记化，停用词，词干等），然后我将它输入验证运算符。(贝叶斯/svm)

这里发生的事情是在示例集中，在从数据运行处理文档后，文本列将返回从常规类型“TEXT”。因此我得到错误Input ExampleSet has no attributes因为有零个常规属性。这导致该过程失败。我不知道为什么。在此之后我尝试再次设置角色，但随后错误显示“示例集中没有示例”

请帮忙。我被困两天了！！！

编辑：我想我知道这个问题 - 我在一个数据集上应用了 10 倍 X-Validation，只有几个例子

machine-learning rapidminer

2013-10-09T11:41:32.350

0 投票

1 回答

382 浏览

nlp - 使用 Rapidminer 计算电子邮件对话的数量

我有一个 Excel 表，其中包含有关问题解决方案的详细信息，其中一列包含针对相应问题的电子邮件对话。本质上，每一行都有一个针对该问题的电子邮件对话（issueid 是该数据的主键）。电子邮件对话格式一致

发件人：“姓名”\n 日期：“时间戳”\n 主题：“主题”\n 收件人：“姓名”\n“正文”

这种模式再次重复......

现在我需要使用 Rapidminer 找出每个问题发生了多少电子邮件对话。我已经阅读了 Excel，Rapidminer 中的每一行都有可用的数据......我该如何做到这一点？

任何帮助将不胜感激......

nlp rapidminer

2013-10-10T04:42:14.850

问题标签 [rapidminer]

Reference