0

我对机器学习和聚类的概念很陌生。我已经安装了 Weka,并试图弄清楚它是如何工作的。目前,我的训练数据如下。

@relation weather

@attribute year real
@attribute temperature real
@attribute warmer {yes,no}

@data

1956    ,   68.98585    ,   yes
1957    ,   67.52131    ,   yes
1958    ,   65.853386   ,   no
1959    ,   66.32705    ,   yes
1960    ,   65.89773    ,   no

所以,我正在尝试建立一个模型来预测它是否每年都在变暖。

如果我必须预测 1961 年是温暖还是凉爽,我应该提供如下测试数据吗?

@关系天气

@attribute year real
@attribute temperature real

@data

1961    ,   70.98585    

我已经删除了我想使用我之前提供的训练集预测的列加热器。我可以使用 Weka 提供的任何算法(J48、BayesNet 等)。有人可以帮我弄清楚如何理解这些概念吗?

4

1 回答 1

0

您不需要自己制作训练和测试集,Weka 会为您完成。即使你这样做了,也不要从测试集中删除要预测的值——Weka 会确保一切正常,但需要实际值来确定预测是否正确并告诉你模型的执行情况。

您的问题是分类问题,即您要预测标签“是”或“否”。并非 Weka 中的所有算法都适用,但那些不是灰色的(如果您使用 GUI)。

在更一般的说明中,您不太可能使用您拥有的数据获得良好的结果。这更像是一个时间序列预测任务(即给定这些过去的值,它在未来将如何发展),Weka 并没有真正提供算法。您可以在Wikipedia上找到更多信息。

为了使用 Weka 获得更好的模型,您可以添加前一年(或前 2 年)的温度值作为特征,但最终听起来您想使用可以进行时间序列分析和预测的东西。

于 2013-06-25T19:52:21.097 回答