1

我一直在尝试使用 tidytext 包计算词频。

v <- "Everybody dance now! Give me the music Everybody dance now! Give me the music Everybody dance now! Everybody dance now! Yeah! Yeah! Yeah!"
v <- as.character(v)
v %>% count(words)

但我一直收到此错误: UseMethod("as.quoted") 中的错误:没有适用于 'as.quoted' 的方法应用于类“函数”的对象

请帮忙!谢谢!

4

2 回答 2

3

tidytext是允许您将字符串(在数据帧中)转换为单词和其他内容的包。您可以将字符串转换为数据框,然后使用该tidytext方法unnest_tokens将其转换为单词,然后使用单词,然后dplyr使用group_by它们count

tibble(v) %>% tidytext::unnest_tokens(word, v) %>% group_by(word) %>% count()
# A tibble: 8 x 2
# Groups:   word [8]
  word          n
  <chr>     <int>
1 dance         4
2 everybody     4
3 give          2
4 me            2
5 music         2
6 now           4
7 the           2
8 yeah          3
于 2018-02-02T20:00:56.610 回答
0

我正在处理类似的案例并调用 dplyr 与 count() 函数一起使用:

tokens %>%
# call dplyr   
dplyr::count(word)
于 2021-03-08T20:25:31.880 回答