我正在尝试使用tm包进行一些文本挖掘。corpus
所以我从一个字符串向量创建一个。然后我使用tolower
, 删除所有大写字母,这会导致错误。
corpus <- Corpus(VectorSource(string_vector))
corpus <- tm_map(corpus, tolower) # Makes all words lower case
Error in mcfork() :
unable to fork, possible reason: Cannot allocate memory
我用来创建语料库的字符串向量有 5621 行,最长的字符串有 4590 个字符。
我已经使用rm(list=ls())
. 但这没有什么区别。
我在具有 32GB RAM 的服务器上运行它:
R version 3.0.2 (2013-09-25)
Platform: x86_64-pc-linux-gnu (64-bit)
我该如何解决这个问题,或者我的服务器不够强大?