r - 使用 R Studio 从 CSV 中提取短语

Question

使用 RI 想要获取单个 CSV 并提取最常见的两个和三个单词短语。我一直在搜索 Google 和 Stackoverflow，但找不到一个简单的方法来做到这一点。

我知道如何将 CSV 读入 R，但我还没有找到如何将数据提取到适当的数据类型并执行操作以获得我正在寻找的内容。

要求：

此外，哪些数据类型最适合这种类型的分析？数据框？Tm值？语料库？ETC？

My_SRs <- read.csv("C:/example_folder/username/Documents/my_data.csv")

提前致谢！

score 0 · Accepted Answer

从手册中，加载文件：

txt <- system.file("my_data.csv", control = list(removePunctuation = TRUE,
    removeNumbers = TRUE, tolower = TRUE, stopwords = TRUE)))

创建一个corpus：

Corpus(DirSource(txt)

从那里，您可以使用TermDocumentMatrix或采用不同的路线PlainTextDocument来termFreq传递词频。

1 回答 1