15

我正在尝试使用逻辑回归模型对一些 EEG 数据进行分类(这似乎对我的数据进行了最佳分类)。我拥有的数据来自多通道 EEG 设置,所以本质上我有一个 63 x 116 x 50 的矩阵(即通道 x 时间点 x 试验次数(有两种试验类型 50),我已将其重新调整为长向量,每个试验一个。

我想做的是在分类之后查看哪些特征在对试验进行分类时最有用。我该怎么做?是否可以测试这些功能的重要性?例如,分类主要由 N 个特征驱动,这些是特征 x 到 z。因此,例如,我可以说通道 10 在时间点 90-95 对分类很重要或很重要。

那么这是可能的还是我问错了问题?

非常感谢任何评论或论文参考。

4

1 回答 1

39

Scikit-learn 包含不少特征排序方法,其中:

(见http://scikit-learn.org/stable/modules/feature_selection.html更多)

其中,我绝对推荐给 Randomized Logistic Regression 一个机会。根据我的经验,它始终优于其他方法并且非常稳定。关于此的论文:http: //arxiv.org/pdf/0809.2932v2.pdf

编辑: 我写了一系列关于不同特征选择方法及其优缺点的博客文章,这可能有助于更详细地回答这个问题:

于 2013-04-03T22:05:38.840 回答