0

使用 Weka 的鲍鱼数据集上的 ANN 和 KNN。

ANN 正确分类实例的结果 3183 76.203 % 错误分类实例 994 23.797 % 平均绝对误差 0.214 均方根误差 0.3349 相对绝对误差 58.6486 %

KNN的结果| 正确分类的实例 3211 76.8734 % 错误分类的实例 966 23.1266 % 平均绝对误差 0.2142 均方根误差 0.3361 相对绝对误差 58.7113 %

KNN 精度高,而 ANN 误差低。那么我应该说这两种算法中哪一种更好呢?哪个是更可取的标准,准确性还是错误?我的理解是错误应该随着高精度而减少。但是这里的结果是相反的。为什么会这样呢?

4

1 回答 1

1

答案取决于您是将问题视为分类(如您使用的算法所建议的那样)还是回归。如果这是一个分类问题,那么您应该只考虑正确/错误分类实例的百分比。否则,错误。

解释一下,正确分类实例的百分比仅考虑预测是否准确,即预测 2 而不是 1 与预测 10000 一样不正确。原因是你得到了数据的类别错误并且没有类之间差异大小的概念。另一方面,对于回归,您预测一个连续的数量,并且差异的大小很重要。也就是说,如果实际值为 1,预测值为 2,则模型比预测为 10000 时的模型要好得多。

这样,您可以获得更好的准确性,但误差更差,反之亦然。发生的情况是,您总体上得到了更正确的预测,但错误的预测更离谱。

您想要使用哪种性能衡量标准取决于您的特定应用程序。您是否只关心是否预测了正确的类别,或者还关心到正确预测的距离?如果是后者,我建议使用回归而不是分类模型。

于 2013-05-30T06:54:32.493 回答