1

我正在使用 RapidMiner 5.3.013。我正在从 Remedy 读取包含数千行工作日志的 excel 文件。我想根据正则表达式删除文本,^[A-Z][\w\d/?(# ]+[\w0-9#)]{2}:然后使用 Process Documents from Data。到目前为止还没有想出如何做到这一点。我可能只是编写 VBA,但想知道如何在 Rapidminer 中完成。

4

1 回答 1

0

读取 Excel 数据后,确保将要由 Process Documents 操作员处理的字段设置为输入文本。使用 Nominal to Text 运算符执行此操作。在流程文档循环中,使用 Tokenize 运算符将数据拆分为标记。使用 Filter Tokens 运算符删除您不想要的任何令牌。该运算符将正则表达式作为参数。确保在此运算符上设置了反转标志以删除您不想要的令牌而不是保留它们

于 2013-09-25T19:44:48.517 回答