我想在 R 中使用许多(例如 100k)特征进行大规模回归(线性/逻辑),其中每个示例在特征空间中相对稀疏——例如,每个示例约 1k 个非零特征。
看起来SparseM包slm
应该这样做,但我很难从sparseMatrix
格式转换为slm
友好的格式。
我有一个标签的数字向量y
和一个sparseMatrix
特征X
\in {0,1}。当我尝试
model <- slm(y ~ X)
我收到以下错误:
Error in model.frame.default(formula = y ~ X) :
invalid type (S4) for variable 'X'
大概是因为slm
想要一个SparseM
对象而不是一个sparseMatrix
.
是否有一种简单的方法可以a)SparseM
直接填充对象或b)将a转换sparseMatrix
为SparseM
对象?或者也许有更好/更简单的方法来做到这一点?
X
(我想我可以使用and明确地编写线性回归的解决方案y
,但如果能slm
工作就好了。)