我带着一个问题回来了。我正在使用 Rapid Miner 进行自动文本分类,但无法正常工作。我收到一条错误消息,上面写着“示例中没有设置示例,冒犯了操作员的性能”。知道那是指什么吗?
3 回答
在 RapidMiner 中,您必须先使用转换器组件,然后才能将其用作示例集。因此,例如,如果您的输出为“doc”,则必须使用组件“Documents to Data”才能将其链接到下一个输入“exa”。就这样!
如果它说没有示例集,那么问题可能出在您的原始数据上。您可以发布您的过程的图像吗?
例如,确保您已将初始输入连接到您的操作员 - 错误发生在哪两个操作员上?
一个想法:文本挖掘中设置的示例通常是您的文档集合,但是如果您真的使用文档(PDF,Word),那么您的格式将是文档(Doc),并且您可能需要将文档转换为数据(Documents to数据运算符)。然后您应该有一个示例集,您可以将其输入到您的 Performance 运算符中。
希望这会有所帮助 - 正如前面的评论所说,在不知道过程的情况下,很难准确地判断错误在哪里。
您能否提供有关您的 RapidMiner 文本挖掘过程的更多详细信息?没有更多的上下文,你的问题很难回答。
有关 RapidMiner 的更多帮助,您可能需要查看 RapidMiner 用户论坛:http: //forum.rapid-i.com/
在 RapidMiner Resources,您可以找到有关如何使用 RapidMiner 进行文本挖掘的 RapidMiner 教程视频: http: //rapidminerresources.com/index.php?page=text-mining-3
Rapid-I 还提供 90 分钟的文本挖掘网络研讨会。您可以在 Rapid-I 网页的“服务”和“培训”下或在网上商店中找到它。
我希望这些链接可以帮助您开始使用 RapidMiner 进行自动文本分类。如果您提供有关 RapidMiner 文本挖掘过程的更多详细信息,我也可以直接回答您的问题。