我有以下数据集,
第 1 至 6 列
1.0000 0 0.9954 -0.0589 0.8524 0.0231
1.0000 0 1.0000 -0.1883 0.9304 -0.3616
1.0000 0 1.0000 -0.0336 1.0000 0.0049
1.0000 0 1.0000 -0.4516 1.0000 1.0000
1.0000 0 1.0000 -0.0240 0.9414 0.0653
1.0000 0 0.0234 -0.0059 -0.0992 -0.1195
1.0000 0 0.9759 -0.1060 0.9460 -0.2080
0 0 0 0 0 0
1.0000 0 0.9636 -0.0720 1.0000 -0.1433
我正在尝试使用二进制拆分来构建决策树,其中一个问题是数据继续存在,并且我当前的实现通过保持数据原样并进行拆分而变得计算密集。我必须说,如果你只是构建一个分类器,那就太糟糕了。
就我而言,我正在做十倍并将分类器从 5-50(装袋)增加。我正在考虑以这种方式将数据存储到 0.2 个存储桶中,但我意识到存在负数。我正在使用 matlab 来实现。我是一个 Matlab NewB,不确定是否有预定义的方法来处理这样的场景。