0

我有以下数据,其中包含我使用 Python 脚本提取的“频率”信息。我想使用这些信息WordCloud2在 R中生成一个。

                  WORD VALUE SENT
1         topnotch     1    1
2             good     2    1
3             nice     11    0
4         inspired     14    0
5        beautiful     21    0

由于我已经在上一步中完成了数据预处理和清理,因此我无需执行我正在阅读的所有教程中向我解释的步骤,例如:

  conv2 <- Corpus(VectorSource(abstracts))

      text.corpus = tm_map(conv2, removePunctuation)
      text.corpus = tm_map(text.corpus, content_transformer(tolower))
      text.corpus = tm_map(text.corpus, removeWords, stopwords("english"))

但是,我仍然需要将我的数据转换为适当的矩阵,以便正确对其进行索引以生成 a WordCloud,此索引过程通常包括以下步骤:

 tdm <- TermDocumentMatrix(text.corpus)
      m <- as.matrix(tdm)
      v <- sort(rowSums(m),decreasing=TRUE)
      d <- data.frame(word = names(v),freq=v)

我一直在寻找应该采用什么格式的示例,以便我可以将频率表直接编码为WordCloud2. 谁能指出我的代码方向,因为到目前为止直接将我的表调用到 TDM 中还没有工作,例如:

tdm <- TermDocumentMatrix(mr)
m <- as.matrix(tdm)
v <- sort(rowSums(m),decreasing=TRUE)
d <- data.frame(word = names(v),freq=v)

我收到的错误如下:

Error in UseMethod("TermDocumentMatrix", x) : 
  no applicable method for 'TermDocumentMatrix' applied to an object of class "data.frame"
> m <- as.matrix(tdm)
Error in as.matrix(tdm) : object 'tdm' not found
> v <- sort(rowSums(m),decreasing=TRUE)
> d <- data.frame(word = names(v),freq=v)

尝试时,如下所示使用as.TermDocumentMatrix,我收到以下错误:

> tdm <- as.TermDocumentMatrix(mr)
Error in .TermDocumentMatrix(x, weighting) : 
  argument "weighting" is missing, with no default 
4

0 回答 0