0

我认为标题并没有真正的帮助,但是......让我们走吧。
我有关于候选人推文的数据。它是一个数据框,其中一个名为“推文”的列(每一行我都有不同的推文)。我使用以下函数制作频率表:

frequencytable <- candidate$Tweets %>%
  na.omit() %>%
  tolower() %>%
  strsplit(split = "[ .,!]") %>% # or strsplit(split = "\\W")
  unlist() %>%
  gsub('[.?:!,"\n"]', '', .) %>%
  table() %>%
  sort(decreasing = TRUE)

之后,我得到了这样的结果(一个大表,没有列名,其中行是不同的单词,其对应的频率如下):

hello   bye  good money   red 
  567   321    22    61    98 

格式dput

frequencytable <-
c(hello = 567L, bye = 321L, good = 22L, money = 61L, red = 98L)

(想象数字在单词下方)等等(我认为我有大约 500 次出现)........

现在我想在一个简单的条形图中显示这些结果,但我很努力。
我试过类似的东西:

ggplot(data = candidate$Tweets) + 
  geom_bar(mapping = aes(x = frequencytable))

它不起作用......我做了一些研究,发现了一些提示,例如:将其转换为数据框,然后继续使用 ggplot,但我真的被卡住了。

4

1 回答 1

2

以下是从频率表开始的三个解决方案。

组成一个数据集。

set.seed(2020)
frequencytable <- table(sample(letters[1:4], 100, TRUE))

基地 R。

barplot(frequencytable)

现在,ggplot2解决方案。先加载包。

library(ggplot2)

df1 <- as.data.frame(frequencytable)
ggplot(df1, aes(Var1, Freq)) + geom_col()

df2 <- stack(frequencytable)
ggplot(df2, aes(ind, values)) + geom_col()
于 2020-12-19T18:41:20.537 回答