0

使用 readLines() 函数,我导入了一个 txt 文件,该文件将句子存储在多个段落中,如下所示:

sentence1. sentence2. sentence3.

sentence4. sentence5.

sentence6. sentence7.
 

为了进一步分析,我想在我导入的 txt 文件上应用sentiment_by() 函数。当我这样做时,我会收到每个段落的情绪值,而不是整个 txt 文件本身。因此,我想删除 txt 文件中的段落,以便我只收到一个情绪系数。为此,我需要转换我的 txt 文件,使文本如下所示:

sentence1. sentence2. sentence3. sentence4. sentence5. sentence6. sentence7.

如果我要对这段文本运行sentiment_by() 函数,它将为整个文本产生一个系数。在继续分析之前,有没有办法通过删除 R 中的段落来转换文本?

4

1 回答 1

0

如果你抓取的每个段落都是一个字符向量,你可以去掉制表符和换行符(如果需要,还可以去掉其他空白字符)。

trimmed_text = trimws(text_var, which = "both", whitespace = "[\t\r\n]")

您还可以调整其他内容,如下所示

于 2020-08-03T18:10:22.163 回答