我正在使用 WEKA 处理 KDD99 数据集。数据集中有三种类型的属性,即名义型、二进制型和数值型。但在 WEKA 中,它也将二进制数据视为数字。
我尝试使用 Unsupervised-attribute-Normalize 工具来规范化数据。但是,它也会对二进制数据进行规范化。我在这里有两个问题。
我需要标准化二进制属性吗?因为二进制数据是不连续的。
如果我不需要规范化二进制属性,在 WEKA 中,如何在 Normalize 工具中选择属性?因为 Normalize 工具始终适用于所有数值属性(包括二进制属性)。
谢谢!