我必须在 Weka 中运行 J48 决策树算法,以通过它们的 Type 属性对一些花进行分类。在我做任何事情之前,我必须清理我的数据,但是我观察到我的 Type 属性具有以下值:
我应该删除具有未知标签的数据吗?
我首先要做的是用所有脏数据运行我的分类器,我得到了 ~89% 的准确度和 0.85 的 F-Measure。
在我清理了我的数据(保持未知状态)之后,我的模型的准确性降低了。如果我忽略所有带有 uknown 标签的数据,我的准确性会大大提高。
您的意见是什么,在这种情况下我应该怎么做?非常感谢您的帮助