2

我正在尝试对推文进行一些文本分析,并尝试将 LSA() 用于 DR。但是,似乎计算 lsa 空间非常消耗内存。我最多只能处理 2.3k 条推文,否则我的电脑会死机。

当我通过在线资源研究并行处理时,我了解到,即使我的计算机是 4 核,我也只会使用其中的 1 个,因为这是 R 中的默认设置。我也在这里阅读了这篇文章,非常有帮助,但似乎只能进行并行处理:

  1. 关于可在 apply() 系列中使用的函数
  2. 替换 for 循环

我正在尝试对 lsa() 使用并行处理。这是我的一行代码:

lsa.train = lsa(tdm.train, dimcalc_share())

其中tdm.train是一个 TermDocumentMatrix,其中术语为行,文档为列。

我的问题是:

如何更改 lsa() 的这行代码,以便它以并行格式而不是顺序格式处理?这样它将使用 n 个内核而不是仅 1 个内核,其中 n 是用户(我)定义的内核数。

4

0 回答 0