1

我有一个 Excel 表,其中每一行都表示和问题及其描述。每行对应的一列表示有关该问题的详细信息,这是我想要挖掘的。我想找出每个单元格中每个标记的出现,然后相应地对每一行进行分类(例如,如果特定标记出现超过 x 次,我将用该标记标记该行)。当我使用 Rapidminer 执行此操作时,它会将所有行放在一起,并告诉每个令牌在所有行中出现的次数,而不是一次获取每一行。如何让 Rapidminer 一次获取每一行并确定每一行的令牌频率并应用 n 克等...

4

1 回答 1

2

听起来您正在使用 Process Documents from Data 运算符,输入来自电子表格,其属性设置为文本类型。在此运算符中,有一个 Tokenize 运算符。

如果您将 Process Documents 运算符的参数设置为“术语出现次数”,您将获得令牌在示例集中出现的次数的计数。

于 2013-11-08T18:37:19.107 回答