我想在 R 中使用许多(例如 100k)特征进行大规模回归(线性/逻辑),其中每个示例在特征空间中相对稀疏——例如,每个示例约 1k 个非零特征。
看起来SparseM包slm应该这样做,但我很难从sparseMatrix格式转换为slm友好的格式。
我有一个标签的数字向量y和一个sparseMatrix特征X\in {0,1}。当我尝试
model <- slm(y ~ X)
我收到以下错误:
Error in model.frame.default(formula = y ~ X) :
invalid type (S4) for variable 'X'
大概是因为slm想要一个SparseM对象而不是一个sparseMatrix.
是否有一种简单的方法可以a)SparseM直接填充对象或b)将a转换sparseMatrix为SparseM对象?或者也许有更好/更简单的方法来做到这一点?
X(我想我可以使用and明确地编写线性回归的解决方案y,但如果能slm工作就好了。)