1

我有两个具有不同属性尺度的类的大型数据集(例如,一些属性从 5 到 10,其他从 0 到 100)。我知道如果我直接使用 kNN 算法,差异将使分析无效,我需要对属性进行规范化。

WEKA 上的一些分类器似乎可以进行标准化,例如 RBF 或 SMO,但我需要使用其他分类器,首先是 IBK 分类器 (KNN)。

weka 是否以某种方式引领它?如何在 KNN 分类中加入规范化过程?

谢谢

4

2 回答 2

0

为了获得最大的自由度(以最适合您的方式转换属性的能力:标准化、最小-最大标准化等),您可以使用例如 MATLAB(或 Python ...)来标准化您的属性。为此,您必须以矩阵的形式加载/存储数据集(其中列对应于您的属性,而行对应于您的训练实例/示例,通常用于 CSV 文件)。然后,您可以轻松地对列进行操作,例如遍历每列并对其进行规范化。

最后,您可以将具有标准化特征的新数据集输入 Weka。

于 2015-07-15T14:55:11.313 回答
0

在“预处理”面板中,有一个名为“标准化”的无监督属性过滤器。

于 2015-07-16T07:42:32.280 回答