我开始使用 tidytext 来获取文本文件的基本词频,其中包含电子邮件集合和大量垃圾。
脚本的相关部分是:
library(tidytext)
data <- read_lines("emails.txt")
text_tibble <- tibble(line = seq_along(data), text = data)
text_tibble %>%
unnest_tokens_(word, text)
错误:无法将函数转换为 quosure
你能给我定位吗?谢谢。 dput(text_tibble)的原始数据结果