2

我可以使用聚类(例如使用 k-means)在 Weka 中进行预测吗?

我有一些基于总统选举研究的数据。我有问卷的答案(数字属性),我有一个属性是你要投票给谁?(1、2 或 3)

我在 Weka 中使用一些分类器(例如贝叶斯)进行预测。我的结果基于那个答案(投票意图),我有大约 60% 的召回率(正确预测率)。

我知道聚类是另一回事,但我可以使用聚类进行预测吗?我已经尝试过,但我意识到聚类总是选择自己的质心,并且它不使用我的投票意图问题。

4

2 回答 2

3

解释 K-means 的结果

一定是你的同事。他似乎使用了相同的数据集,如果我们都可以查看数据会有所帮助。

一般来说,聚类不是分类或预测。

但是,您可以尝试使用从聚类中获得的信息来改进您的分类。两种这样的技术:

  • 用集群中心替换您的数据集,并将其用于分类(至少如果您的集群对于类标签来说是相当纯的!)
  • 在每个集群上训练一个单独的分类器,并从中构建一个集合(特别是,如果您的集群是不均匀的)

但我相信您对分类或聚类的理解还不足以尝试这些。您需要小心处理它们,并且非常了解您的数据。

于 2013-04-28T23:45:54.143 回答
0

是的。您可以使用 Weka 界面通过聚类进行预测。首先,使用Preprocess 选项卡上传您的训练数据。然后,转到分类选项卡,在分类器下,单击选择并在下,选择ClassificationViaClustering。weka 使用的默认聚类算法是 SimpleKMean,但您可以通过单击选项字符串(即选择按钮旁边的文本)来更改它,weka 将显示一个消息框,单击选择并且会列出一组聚类算法供您选择(例如 EM)。之后,您可以像使用 weka 进行分类时一样通过单击设置来进行交叉验证或上传测试数据。

希望这会帮助任何有同样问题的人!

于 2013-12-28T16:13:41.663 回答