我有以下数据,其中包含我使用 Python 脚本提取的“频率”信息。我想使用这些信息WordCloud2
在 R中生成一个。
WORD VALUE SENT
1 topnotch 1 1
2 good 2 1
3 nice 11 0
4 inspired 14 0
5 beautiful 21 0
由于我已经在上一步中完成了数据预处理和清理,因此我无需执行我正在阅读的所有教程中向我解释的步骤,例如:
conv2 <- Corpus(VectorSource(abstracts))
text.corpus = tm_map(conv2, removePunctuation)
text.corpus = tm_map(text.corpus, content_transformer(tolower))
text.corpus = tm_map(text.corpus, removeWords, stopwords("english"))
但是,我仍然需要将我的数据转换为适当的矩阵,以便正确对其进行索引以生成 a WordCloud
,此索引过程通常包括以下步骤:
tdm <- TermDocumentMatrix(text.corpus)
m <- as.matrix(tdm)
v <- sort(rowSums(m),decreasing=TRUE)
d <- data.frame(word = names(v),freq=v)
我一直在寻找应该采用什么格式的示例,以便我可以将频率表直接编码为WordCloud2
. 谁能指出我的代码方向,因为到目前为止直接将我的表调用到 TDM 中还没有工作,例如:
tdm <- TermDocumentMatrix(mr)
m <- as.matrix(tdm)
v <- sort(rowSums(m),decreasing=TRUE)
d <- data.frame(word = names(v),freq=v)
我收到的错误如下:
Error in UseMethod("TermDocumentMatrix", x) :
no applicable method for 'TermDocumentMatrix' applied to an object of class "data.frame"
> m <- as.matrix(tdm)
Error in as.matrix(tdm) : object 'tdm' not found
> v <- sort(rowSums(m),decreasing=TRUE)
> d <- data.frame(word = names(v),freq=v)
尝试时,如下所示使用as.TermDocumentMatrix
,我收到以下错误:
> tdm <- as.TermDocumentMatrix(mr)
Error in .TermDocumentMatrix(x, weighting) :
argument "weighting" is missing, with no default