我有一个矩阵如下sdist
。R
library("babynames")
library("stringdist")
d <- babynames
sdist <- stringdistmatrix(d$name[1:1000], d$name[1001:10000], method="lv", useBytes = T)
sdist[sdist > 3] <- Inf
即使只有少数几种元素,这个矩阵的大小也很大。
object.size(sdist)
72000112 bytes
dim(sdist)
[1] 1000 9000
length(sdist)
[1] 9000000
table(sdist)
sdist
0 1 2 3 Inf
4093 12125 72937 381084 8529761
有什么办法可以减小这些矩阵的大小。我不能使用稀疏矩阵,因为 0 的数量较少。