我可以使用聚类(例如使用 k-means)在 Weka 中进行预测吗?
我有一些基于总统选举研究的数据。我有问卷的答案(数字属性),我有一个属性是你要投票给谁?(1、2 或 3)
我在 Weka 中使用一些分类器(例如贝叶斯)进行预测。我的结果基于那个答案(投票意图),我有大约 60% 的召回率(正确预测率)。
我知道聚类是另一回事,但我可以使用聚类进行预测吗?我已经尝试过,但我意识到聚类总是选择自己的质心,并且它不使用我的投票意图问题。
我可以使用聚类(例如使用 k-means)在 Weka 中进行预测吗?
我有一些基于总统选举研究的数据。我有问卷的答案(数字属性),我有一个属性是你要投票给谁?(1、2 或 3)
我在 Weka 中使用一些分类器(例如贝叶斯)进行预测。我的结果基于那个答案(投票意图),我有大约 60% 的召回率(正确预测率)。
我知道聚类是另一回事,但我可以使用聚类进行预测吗?我已经尝试过,但我意识到聚类总是选择自己的质心,并且它不使用我的投票意图问题。
一定是你的同事。他似乎使用了相同的数据集,如果我们都可以查看数据会有所帮助。
一般来说,聚类不是分类或预测。
但是,您可以尝试使用从聚类中获得的信息来改进您的分类。两种这样的技术:
但我相信您对分类或聚类的理解还不足以尝试这些。您需要小心处理它们,并且非常了解您的数据。
是的。您可以使用 Weka 界面通过聚类进行预测。首先,使用Preprocess 选项卡上传您的训练数据。然后,转到分类选项卡,在分类器下,单击选择并在元下,选择ClassificationViaClustering。weka 使用的默认聚类算法是 SimpleKMean,但您可以通过单击选项字符串(即选择按钮旁边的文本)来更改它,weka 将显示一个消息框,单击选择并且会列出一组聚类算法供您选择(例如 EM)。之后,您可以像使用 weka 进行分类时一样通过单击设置来进行交叉验证或上传测试数据。
希望这会帮助任何有同样问题的人!