我有超过 20k 个特征、3m 个对象和超过 3k 个类的文本分类问题。数据非常稀疏。我在 R. sparseMatrix 对象中的数据矩阵上编写了程序。如何选择此数据的特征?我找到了 FSelector 包,但它不适用于 sparseMatrix,只有 data.frame,由于内存限制,我无法转换数据。
问问题
534 次
1 回答
0
请看一下:
F选择器:
https://cran.r-project.org/web/packages/FSelector/FSelector.pdf
varSelRF:
https://cran.r-project.org/web/packages/varSelRF/varSelRF.pdf
R,相关矩阵滤波器,PCA 和后向选择:
于 2016-06-22T13:17:36.910 回答