我是 RapidMiner 的新手...我想做的是我有一个包含 10 个文档的列表,我使用 ProcessDocuments 运算符(子任务)-> 标记化这些文档...结果是一个10 x 800 的示例集,有 10 行(每个文档一个)和 800 个属性(每个令牌一个)。
现在我想按长度过滤 800 个令牌,我再次使用 ProcessDocuments 运算符(子任务)-> FilterByLength对由前一个 ProcessDocuments 运算符生成的世界列表...结果是一个 800 乘 700 矩阵...800 来自 800 个令牌之前的 ProcessDocuments Operator 和 700 减少的令牌集。
我想要完成的是一个10 x 700 的示例集,我可以将其传递给 Kmeans 聚类算子。我怎样才能做到这一点?
谢谢