1

我开始使用 tidytext 来获取文本文件的基本词频,其中包含电子邮件集合和大量垃圾。

脚本的相关部分是:

library(tidytext)

data <- read_lines("emails.txt")

text_tibble <- tibble(line = seq_along(data), text = data)

text_tibble %>%
        unnest_tokens_(word, text)

错误:无法将函数转换为 quosure

你能给我定位吗?谢谢。 dput(text_tibble)的原始数据结果

4

1 回答 1

0

tidytext 包确实具有用于标准评估的大多数函数的下划线版本,尽管这些已被弃用以支持 tidyeval 语义。

带下划线的版本的想法是它们按值接受参数,而不是像我们通常习惯使用的通常的非标准评估版本那样通过代码,如 dplyr。如果您想使用带下划线的版本(就像我说的那样,不推荐使用),您需要传递实际值。

text_tibble %>%
    unnest_tokens_("word", "text")
于 2018-04-06T02:56:37.017 回答