-1

我必须在 Weka 中运行 J48 决策树算法,以通过它们的 Type 属性对一些花进行分类。在我做任何事情之前,我必须清理我的数据,但是我观察到我的 Type 属性具有以下值:

类型表示例

我应该删除具有未知标签的数据吗?

我首先要做的是用所有脏数据运行我的分类器,我得到了 ~89% 的准确度和 0.85 的 F-Measure。

在我清理了我的数据(保持未知状态)之后,我的模型的准确性降低了。如果我忽略所有带有 uknown 标签的数据,我的准确性会大大提高。

您的意见是什么,在这种情况下我应该怎么做?非常感谢您的帮助

4

1 回答 1

0

您应该删除未知数。通常,这意味着您尝试预测的属性没有编码,因此您正在添加噪声。

得到模型后,用模型预测未知数。

于 2021-12-21T14:42:58.400 回答