r - 如何在 R 中对 SparseMatrix 矩阵进行特征选择

Question

我有超过 20k 个特征、3m 个对象和超过 3k 个类的文本分类问题。数据非常稀疏。我在 R. sparseMatrix 对象中的数据矩阵上编写了程序。如何选择此数据的特征？我找到了 FSelector 包，但它不适用于 sparseMatrix，只有 data.frame，由于内存限制，我无法转换数据。

score 0 · Accepted Answer

请看一下：

F选择器：

https://cran.r-project.org/web/packages/FSelector/FSelector.pdf

varSelRF：

https://cran.r-project.org/web/packages/varSelRF/varSelRF.pdf

R，相关矩阵滤波器，PCA 和后向选择：

http://www.r-bloggers.com/introduction-to-feature-selection-for-bioinformaticians-using-r-correlation-matrix-filters-pca-backward-selection/

r - 如何在 R 中对 SparseMatrix 矩阵进行特征选择

1 回答 1

Related

Reference