4

我的数据集有 100 个特征的 400 个观察值。400 个观测值中的每一个都属于 2 个类中的 1 个。

我正在 MATLAB 中训练一个神经网络(patternet(15))来对该数据集进行分类。
我不会一次使用所有功能,但首先我使用一个功能 (400x1),然后添加第二个功能 (400x2),依此类推。在每一步,我都使用perfcurve计算 AUC 。

这是我的问题:

AUC 正在发生变化,但并不总是随着每个额外的输入而变大。
随着我使用更多功能来训练网络,AUC 不应该增加吗?(我总是通过divideind使用相同的划分)。

感谢所有评论和帮助!谢谢!

4

1 回答 1

2

也许第一个特征更具辨别力,而最后一个特征只会增加噪音!您可以尝试运行一个随机森林,看看哪些特征是类别之间最具区分性的

于 2014-01-20T07:54:41.733 回答