algorithm - 在 Weka 中使用聚类进行预测

Question

我可以使用聚类（例如使用 k-means）在 Weka 中进行预测吗？

我有一些基于总统选举研究的数据。我有问卷的答案（数字属性），我有一个属性是你要投票给谁？（1、2 或 3）

我在 Weka 中使用一些分类器（例如贝叶斯）进行预测。我的结果基于那个答案（投票意图），我有大约 60% 的召回率（正确预测率）。

我知道聚类是另一回事，但我可以使用聚类进行预测吗？我已经尝试过，但我意识到聚类总是选择自己的质心，并且它不使用我的投票意图问题。

score 3 · Accepted Answer

解释 K-means 的结果

一定是你的同事。他似乎使用了相同的数据集，如果我们都可以查看数据会有所帮助。

一般来说，聚类不是分类或预测。

但是，您可以尝试使用从聚类中获得的信息来改进您的分类。两种这样的技术：

用集群中心替换您的数据集，并将其用于分类（至少如果您的集群对于类标签来说是相当纯的！）
在每个集群上训练一个单独的分类器，并从中构建一个集合（特别是，如果您的集群是不均匀的）

但我相信您对分类或聚类的理解还不足以尝试这些。您需要小心处理它们，并且非常了解您的数据。

score 0 · Accepted Answer

是的。您可以使用 Weka 界面通过聚类进行预测。首先，使用Preprocess 选项卡上传您的训练数据。然后，转到分类选项卡，在分类器下，单击选择并在元下，选择ClassificationViaClustering。weka 使用的默认聚类算法是 SimpleKMean，但您可以通过单击选项字符串（即选择按钮旁边的文本）来更改它，weka 将显示一个消息框，单击选择并且会列出一组聚类算法供您选择（例如 EM）。之后，您可以像使用 weka 进行分类时一样通过单击设置来进行交叉验证或上传测试数据。

希望这会帮助任何有同样问题的人！

algorithm - 在 Weka 中使用聚类进行预测

2 回答 2

Related

Reference