我创建了一个 DocumentTermMatrix,其中包含 1859 个文档(行)和 25722 个(列)。为了对该矩阵执行进一步的计算,我需要将其转换为常规矩阵。我想使用as.matrix()
命令。但是,它返回以下错误:无法分配大小为 364.8 MB 的向量。
> corp
A corpus with 1859 text documents
> mat<-DocumentTermMatrix(corp)
> dim(mat)
[1] 1859 25722
> is(mat)
[1] "DocumentTermMatrix"
> mat2<-as.matrix(mat)
Fehler: kann Vektor der Größe 364.8 MB nicht allozieren # cannot allocate vector of size 364.8 MB
> object.size(mat)
5502000 bytes
由于某种原因,只要将对象转换为常规矩阵,对象的大小似乎就会急剧增加。我怎样才能避免这种情况?
或者是否有另一种方法可以在 DocumentTermMatrix 上执行常规矩阵运算?