weka - WEKA - 天气预报

Question

我对机器学习和聚类的概念很陌生。我已经安装了 Weka，并试图弄清楚它是如何工作的。目前，我的训练数据如下。

@relation weather

@attribute year real
@attribute temperature real
@attribute warmer {yes,no}

@data

1956    ,   68.98585    ,   yes
1957    ,   67.52131    ,   yes
1958    ,   65.853386   ,   no
1959    ,   66.32705    ,   yes
1960    ,   65.89773    ,   no

所以，我正在尝试建立一个模型来预测它是否每年都在变暖。

如果我必须预测 1961 年是温暖还是凉爽，我应该提供如下测试数据吗？

@关系天气

@attribute year real
@attribute temperature real

@data

1961    ,   70.98585

我已经删除了我想使用我之前提供的训练集预测的列加热器。我可以使用 Weka 提供的任何算法（J48、BayesNet 等）。有人可以帮我弄清楚如何理解这些概念吗？

score 0 · Accepted Answer

您不需要自己制作训练和测试集，Weka 会为您完成。即使你这样做了，也不要从测试集中删除要预测的值——Weka 会确保一切正常，但需要实际值来确定预测是否正确并告诉你模型的执行情况。

您的问题是分类问题，即您要预测标签“是”或“否”。并非 Weka 中的所有算法都适用，但那些不是灰色的（如果您使用 GUI）。

在更一般的说明中，您不太可能使用您拥有的数据获得良好的结果。这更像是一个时间序列预测任务（即给定这些过去的值，它在未来将如何发展），Weka 并没有真正提供算法。您可以在Wikipedia上找到更多信息。

为了使用 Weka 获得更好的模型，您可以添加前一年（或前 2 年）的温度值作为特征，但最终听起来您想使用可以进行时间序列分析和预测的东西。

weka - WEKA - 天气预报

1 回答 1

Related

Reference