我正在使用 tidytext 包进行 n 克文本挖掘。我尝试了 2 列文本,n 克(bigrams)函数对其中一个运行良好,但另一个返回 0 obs。来自同一资源的 2 列,因此没有格式差异,只是内容差异。有谁知道为什么?
代码:
result=unnest_tokens(table,bigrams,txt,token="ngrams",n=2)
我正在使用 tidytext 包进行 n 克文本挖掘。我尝试了 2 列文本,n 克(bigrams)函数对其中一个运行良好,但另一个返回 0 obs。来自同一资源的 2 列,因此没有格式差异,只是内容差异。有谁知道为什么?
代码:
result=unnest_tokens(table,bigrams,txt,token="ngrams",n=2)