0

我目前正在研究应用 ANN、SVM 和线性回归方法来预测基于气象因素(13 个因素)的地区水果产量总数据集是:36

在 WEKA 上实施这些方法时,我得到了不好的结果:就像 MultilayerPreceptron 的情况一样,我的结果是:(我将数据集分为 28 个用于训练,8 个用于测试)=== 运行信息 ===

方案:weka.classifiers.functions.MultilayerPerceptron -L 0.3 -M 0.2 -N 500 -V 0 -S 0 -E 20 -H a -G -R 关系:apr6_data 实例:28 属性:15

构建模型所需时间:3.69 秒

=== 对测试集的预测 ===

inst# actual predicted error 1 2.551 2.36 -0.191 2 2.126 3.079 0.953 3 2.6 1.319 -1.281 4 1.901 3.539 1.638 5 2.146 3.635 1.489 6 2.533 2.917 0.384 7 2.54 2.744 0.204 8 2.82 3.473 0.653

=== 测试集评估 === === 总结 ===

相关系数 -0.4415 平均绝对误差 0.8493 均方根误差 1.0065 相对绝对误差 144.2248 % 相对方根误差 153.5097 % 实例总数 8

In case of SVM for regression : inst# actual predicted error 1 2.551 2.538 -0.013 2 2.126 2.568 0.442 3 2.6 2.335 -0.265 4 1.901 2.556 0.655 5 2.146 2.632 0.486 6 2.533 2.24 -0.293 7 2.54 2.766 0.226 8 2.82 3.175 0.355

=== 测试集评估 === === 总结 ===

相关系数 0.2888 平均绝对误差 0.3417 均方根误差 0.3862 相对绝对误差 58.0331 % 相对方根误差 58.9028 % 实例总数 8

我的应用程序中可能出现的错误是什么?请告诉我 !谢谢

4

1 回答 1

0

我需要规范化数据吗?我猜它是由 WEKA 分类器完成的。

如果你想规范化数据,你必须这样做。预处理选项卡->过滤器(选择)->然后找到规范化,然后单击应用。

如果要离散化数据,则必须遵循相同的过程。

如果将预测离散化为低/中/高产量,您可能会更幸运。

您需要标准化或离散化——这不能根据您的数据或单次运行来说明。例如,离散化为朴素贝叶分类器带来了更好的结果。对于 SVM-不确定。

我没有从您的数据中看到您的 Precision、Recall 或 F 分数。但是正如您所说,您在测试集上的结果很差,那么您的分类器很可能正在经历过拟合。尝试增加训练实例(我猜 36 太少了)。当您增加培训实例时,请让我们发布正在发生的事情。

于 2012-04-08T22:30:34.100 回答