java - 快速矿工 101

Question

我带着一个问题回来了。我正在使用 Rapid Miner 进行自动文本分类，但无法正常工作。我收到一条错误消息，上面写着“示例中没有设置示例，冒犯了操作员的性能”。知道那是指什么吗？

score 1 · Accepted Answer

在 RapidMiner 中，您必须先使用转换器组件，然后才能将其用作示例集。因此，例如，如果您的输出为“doc”，则必须使用组件“Documents to Data”才能将其链接到下一个输入“exa”。就这样！

score 0 · Accepted Answer

如果它说没有示例集，那么问题可能出在您的原始数据上。您可以发布您的过程的图像吗？

例如，确保您已将初始输入连接到您的操作员 - 错误发生在哪两个操作员上？

一个想法：文本挖掘中设置的示例通常是您的文档集合，但是如果您真的使用文档（PDF，Word），那么您的格式将是文档（Doc），并且您可能需要将文档转换为数据（Documents to数据运算符）。然后您应该有一个示例集，您可以将其输入到您的 Performance 运算符中。

希望这会有所帮助 - 正如前面的评论所说，在不知道过程的情况下，很难准确地判断错误在哪里。

score 0 · Accepted Answer

您能否提供有关您的 RapidMiner 文本挖掘过程的更多详细信息？没有更多的上下文，你的问题很难回答。

有关 RapidMiner 的更多帮助，您可能需要查看 RapidMiner 用户论坛：http: //forum.rapid-i.com/

在 RapidMiner Resources，您可以找到有关如何使用 RapidMiner 进行文本挖掘的 RapidMiner 教程视频： http: //rapidminerresources.com/index.php?page=text-mining-3

Rapid-I 还提供 90 分钟的文本挖掘网络研讨会。您可以在 Rapid-I 网页的“服务”和“培训”下或在网上商店中找到它。

我希望这些链接可以帮助您开始使用 RapidMiner 进行自动文本分类。如果您提供有关 RapidMiner 文本挖掘过程的更多详细信息，我也可以直接回答您的问题。

3 回答 3